Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition
![Język publikacji: angielski Język publikacji: angielski](https://static01.helion.com.pl/global/flagi/1.png)
- Autorzy:
- Peter Bruce, Andrew Bruce, Peter Gedeck
![Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition Peter Bruce, Andrew Bruce, Peter Gedeck - okładka ebooka](https://static01.helion.com.pl/global/okladki/326x466/e_1uaf.png)
![Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition Peter Bruce, Andrew Bruce, Peter Gedeck - tył okładki ebooka](https://static01.helion.com.pl/global/okladki-tyl/326x466/e_1uaf.png)
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 368
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition
Statistical methods are a key part of data science, yet few data scientists have formal statistical training. Courses and books on basic statistics rarely cover the topic from a data science perspective. The second edition of this popular guide adds comprehensive examples in Python, provides practical guidance on applying statistical methods to data science, tells you how to avoid their misuse, and gives you advice on what’s important and what’s not.
Many data science resources incorporate statistical methods but lack a deeper statistical perspective. If you’re familiar with the R or Python programming languages and have some exposure to statistics, this quick reference bridges the gap in an accessible, readable format.
With this book, you’ll learn:
- Why exploratory data analysis is a key preliminary step in data science
- How random sampling can reduce bias and yield a higher-quality dataset, even with big data
- How the principles of experimental design yield definitive answers to questions
- How to use regression to estimate outcomes and detect anomalies
- Key classification techniques for predicting which categories a record belongs to
- Statistical machine learning methods that "learn" from data
- Unsupervised learning methods for extracting meaning from unlabeled data
Wybrane bestsellery
-
Metody statystyczne są kluczowym elementem data science, mimo to niewielu specjalistów data science posiada formalne wykształcenie statystyczne. Kursy i podręczniki o podstawach statystyki, rzadko kiedy omawiają temat z perspektywy data science. W drugim wydaniu tego popularnego podręcznika zosta...
Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
(41.40 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych...
Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym
(44.85 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Pytest – nowoczesny framework do uruchamiania testów automatycznych w języku Python. Można używać tej platformy do przeprowadzania testów jednostkowych, ale sprawdzi się świetnie także podczas konstruowania rozbudowanych testów wyższego poziomu (integracyjnych, end-to-end) dla całych aplika...
Pytest. Kurs video. Automatyzacja testów w Pythonie Pytest. Kurs video. Automatyzacja testów w Pythonie
(67.05 zł najniższa cena z 30 dni)81.95 zł
149.00 zł(-45%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(53.40 zł najniższa cena z 30 dni)53.40 zł
89.00 zł(-40%) -
Sposobów na naukę Pythona jest sporo i powstało na ten temat mnóstwo publikacji. Jeżeli ten wybór jest właśnie przed Tobą, rozważ naukę Pythona poprzez tworzenie prostych gier. Ich programowanie to nie tylko świetna zabawa, ale też doskonała metoda rozwijania umiejętności algorytmicznych, kreatyw...
Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm
(51.60 zł najniższa cena z 30 dni)70.95 zł
129.00 zł(-45%) -
To trzecie, zaktualizowane i uzupełnione wydanie bestsellerowego podręcznika programowania w Pythonie. Naukę rozpoczniesz od podstawowych koncepcji programowania. Poznasz takie pojęcia jak zmienne, listy, klasy i pętle, a następnie utrwalisz je dzięki praktycznym ćwiczeniom. Dowiesz się, jak zape...(71.40 zł najniższa cena z 30 dni)
71.40 zł
119.00 zł(-40%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(107.40 zł najniższa cena z 30 dni)107.40 zł
179.00 zł(-40%) -
Ta książka stanowi przystępne wprowadzenie do świata projektantów i budowniczych robotów. Dzięki niej dowiesz się, jak wybrać potrzebne podzespoły, jak je ze sobą połączyć i jak wykorzystywać poszczególne urządzenia wejścia i wyjścia. Posłużysz się w tym celu płytką Raspberry Pi i kompatybilnymi ...
Jak zaprogramować robota. Zastosowanie Raspberry Pi i Pythona w tworzeniu autonomicznych robotów. Wydanie II Jak zaprogramować robota. Zastosowanie Raspberry Pi i Pythona w tworzeniu autonomicznych robotów. Wydanie II
(59.40 zł najniższa cena z 30 dni)59.40 zł
99.00 zł(-40%) -
Fachowcy z branży IT, by dobrze wykonywać swoją pracę, muszą w niej zwykle używać od kilku do kilkunastu narzędzi. Z drugiej strony nikt nie jest w stanie dobrze poznać nawet wycinka wszystkich technologii, języków programowania czy aplikacji, które powstają każdego roku. Czy wśród tego bogactwa,...
Receptura na Python. Kurs Video. 54 praktyczne porady dla programistów Receptura na Python. Kurs Video. 54 praktyczne porady dla programistów
(39.90 zł najniższa cena z 30 dni)109.45 zł
199.00 zł(-45%) -
Python to jeden z najpopularniejszych dynamicznych języków programowania. Nie od dziś znajduje on zastosowanie w różnych dziedzinach informatyki, zwłaszcza jako doskonały język skryptowy. Jeśli korzystasz z niego na co dzień i chcesz szybko wyszukiwać niezbędne informacje lub odświeżyć swoją wied...(8.49 zł najniższa cena z 30 dni)
8.49 zł
17.00 zł(-50%)
O autorach ebooka
Peter Bruce jest ekspertem w dziedzinie nauczania statystyki. Prowadzi Institute for Statistics Education, gdzie oferuje setki kursów skierowanych między innymi do naukowców.
Dr Andrew Bruce jest głównym analitykiem w Amazonie. Od trzydziestu lat zajmuje się statystyką i nauką o danych, opracowując rozwiązania problemów z wielu branż.
Dr Peter Gedeck jest badaczem w Collaborative Drug Discovery. Tworzy algorytmy uczenia maszynowego do przewidywania właściwości substancji stanowiących potencjalne leki.
Kup polskie wydanie:
Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
- Autor:
- Peter Bruce, Andrew Bruce, Peter Gedeck
34,50 zł
69,00 zł
(34.50 zł najniższa cena z 30 dni)
Ebooka "Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-920-7289-8, 9781492072898
- Data wydania ebooka:
-
2020-04-10
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 9.7MB
- Rozmiar pliku Mobi:
- 26.0MB
Spis treści ebooka
- Preface
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- 1. Exploratory Data Analysis
- Elements of Structured Data
- Further Reading
- Elements of Structured Data
- Rectangular Data
- Data Frames and Indexes
- Nonrectangular Data Structures
- Further Reading
- Estimates of Location
- Mean
- Median and Robust Estimates
- Outliers
- Example: Location Estimates of Population and Murder Rates
- Further Reading
- Estimates of Variability
- Standard Deviation and Related Estimates
- Estimates Based on Percentiles
- Example: Variability Estimates of State Population
- Further Reading
- Exploring the Data Distribution
- Percentiles and Boxplots
- Frequency Tables and Histograms
- Density Plots and Estimates
- Further Reading
- Exploring Binary and Categorical Data
- Mode
- Expected Value
- Probability
- Further Reading
- Correlation
- Scatterplots
- Further Reading
- Exploring Two or More Variables
- Hexagonal Binning and Contours (Plotting Numeric Versus Numeric Data)
- Two Categorical Variables
- Categorical and Numeric Data
- Visualizing Multiple Variables
- Further Reading
- Summary
- 2. Data and Sampling Distributions
- Random Sampling and Sample Bias
- Bias
- Random Selection
- Size Versus Quality: When Does Size Matter?
- Sample Mean Versus Population Mean
- Further Reading
- Random Sampling and Sample Bias
- Selection Bias
- Regression to the Mean
- Further Reading
- Sampling Distribution of a Statistic
- Central Limit Theorem
- Standard Error
- Further Reading
- The Bootstrap
- Resampling Versus Bootstrapping
- Further Reading
- Confidence Intervals
- Further Reading
- Normal Distribution
- Standard Normal and QQ-Plots
- Long-Tailed Distributions
- Further Reading
- Students t-Distribution
- Further Reading
- Binomial Distribution
- Further Reading
- Chi-Square Distribution
- Further Reading
- F-Distribution
- Further Reading
- Poisson and Related Distributions
- Poisson Distributions
- Exponential Distribution
- Estimating the Failure Rate
- Weibull Distribution
- Further Reading
- Summary
- 3. Statistical Experiments and Significance Testing
- A/B Testing
- Why Have a Control Group?
- Why Just A/B? Why Not C, D,?
- Further Reading
- A/B Testing
- Hypothesis Tests
- The Null Hypothesis
- Alternative Hypothesis
- One-Way Versus Two-Way Hypothesis Tests
- Further Reading
- Resampling
- Permutation Test
- Example: Web Stickiness
- Exhaustive and Bootstrap Permutation Tests
- Permutation Tests: The Bottom Line for Data Science
- Further Reading
- Statistical Significance and p-Values
- p-Value
- Alpha
- p-value controversy
- Practical significance
- Type 1 and Type 2 Errors
- Data Science and p-Values
- Further Reading
- t-Tests
- Further Reading
- Multiple Testing
- Further Reading
- Degrees of Freedom
- Further Reading
- ANOVA
- F-Statistic
- Two-Way ANOVA
- Further Reading
- Chi-Square Test
- Chi-Square Test: A Resampling Approach
- Chi-Square Test: Statistical Theory
- Fishers Exact Test
- Relevance for Data Science
- Further Reading
- Multi-Arm Bandit Algorithm
- Further Reading
- Power and Sample Size
- Sample Size
- Further Reading
- Summary
- 4. Regression and Prediction
- Simple Linear Regression
- The Regression Equation
- Fitted Values and Residuals
- Least Squares
- Prediction Versus Explanation (Profiling)
- Further Reading
- Simple Linear Regression
- Multiple Linear Regression
- Example: King County Housing Data
- Assessing the Model
- Cross-Validation
- Model Selection and Stepwise Regression
- Weighted Regression
- Further Reading
- Prediction Using Regression
- The Dangers of Extrapolation
- Confidence and Prediction Intervals
- Factor Variables in Regression
- Dummy Variables Representation
- Factor Variables with Many Levels
- Ordered Factor Variables
- Interpreting the Regression Equation
- Correlated Predictors
- Multicollinearity
- Confounding Variables
- Interactions and Main Effects
- Regression Diagnostics
- Outliers
- Influential Values
- Heteroskedasticity, Non-Normality, and Correlated Errors
- Partial Residual Plots and Nonlinearity
- Polynomial and Spline Regression
- Polynomial
- Splines
- Generalized Additive Models
- Further Reading
- Summary
- 5. Classification
- Naive Bayes
- Why Exact Bayesian Classification Is Impractical
- The Naive Solution
- Numeric Predictor Variables
- Further Reading
- Naive Bayes
- Discriminant Analysis
- Covariance Matrix
- Fishers Linear Discriminant
- A Simple Example
- Further Reading
- Logistic Regression
- Logistic Response Function and Logit
- Logistic Regression and the GLM
- Generalized Linear Models
- Predicted Values from Logistic Regression
- Interpreting the Coefficients and Odds Ratios
- Linear and Logistic Regression: Similarities and Differences
- Fitting the model
- Assessing the Model
- Analysis of residuals
- Further Reading
- Evaluating Classification Models
- Confusion Matrix
- The Rare Class Problem
- Precision, Recall, and Specificity
- ROC Curve
- AUC
- Lift
- Further Reading
- Strategies for Imbalanced Data
- Undersampling
- Oversampling and Up/Down Weighting
- Data Generation
- Cost-Based Classification
- Exploring the Predictions
- Further Reading
- Summary
- 6. Statistical Machine Learning
- K-Nearest Neighbors
- A Small Example: Predicting Loan Default
- Distance Metrics
- One Hot Encoder
- Standardization (Normalization, z-Scores)
- Choosing K
- KNN as a Feature Engine
- K-Nearest Neighbors
- Tree Models
- A Simple Example
- The Recursive Partitioning Algorithm
- Measuring Homogeneity or Impurity
- Stopping the Tree from Growing
- Controlling tree complexity in R
- Controlling tree complexity in Python
- Predicting a Continuous Value
- How Trees Are Used
- Further Reading
- Bagging and the Random Forest
- Bagging
- Random Forest
- Variable Importance
- Hyperparameters
- Boosting
- The Boosting Algorithm
- XGBoost
- Regularization: Avoiding Overfitting
- Hyperparameters and Cross-Validation
- Summary
- 7. Unsupervised Learning
- Principal Components Analysis
- A Simple Example
- Computing the Principal Components
- Interpreting Principal Components
- Correspondence Analysis
- Further Reading
- Principal Components Analysis
- K-Means Clustering
- A Simple Example
- K-Means Algorithm
- Interpreting the Clusters
- Selecting the Number of Clusters
- Hierarchical Clustering
- A Simple Example
- The Dendrogram
- The Agglomerative Algorithm
- Measures of Dissimilarity
- Model-Based Clustering
- Multivariate Normal Distribution
- Mixtures of Normals
- Selecting the Number of Clusters
- Further Reading
- Scaling and Categorical Variables
- Scaling the Variables
- Dominant Variables
- Categorical Data and Gowers Distance
- Problems with Clustering Mixed Data
- Summary
- Bibliography
- Index
O'Reilly Media - inne książki
-
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(201.03 zł najniższa cena z 30 dni)
200.93 zł
239.00 zł(-16%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(241.36 zł najniższa cena z 30 dni)
241.26 zł
289.00 zł(-17%) -
Frontend developers have to consider many things: browser compatibility, usability, performance, scalability, SEO, and other best practices. But the most fundamental aspect of creating websites is one that often falls short: accessibility. Accessibility is the cornerstone of any website, and if a...(200.59 zł najniższa cena z 30 dni)
200.09 zł
239.00 zł(-16%) -
In this insightful and comprehensive guide, Addy Osmani shares more than a decade of experience working on the Chrome team at Google, uncovering secrets to engineering effectiveness, efficiency, and team success. Engineers and engineering leaders looking to scale their effectiveness and drive tra...(114.93 zł najniższa cena z 30 dni)
114.88 zł
149.00 zł(-23%) -
Data modeling is the single most overlooked feature in Power BI Desktop, yet it's what sets Power BI apart from other tools on the market. This practical book serves as your fast-forward button for data modeling with Power BI, Analysis Services tabular, and SQL databases. It serves as a starting ...(199.08 zł najniższa cena z 30 dni)
198.88 zł
239.00 zł(-17%) -
C# is undeniably one of the most versatile programming languages available to engineers today. With this comprehensive guide, you'll learn just how powerful the combination of C# and .NET can be. Author Ian Griffiths guides you through C# 12.0 and .NET 8 fundamentals and techniques for building c...(241.02 zł najniższa cena z 30 dni)
240.92 zł
289.00 zł(-17%) -
Learn how to get started with Futures Thinking. With this practical guide, Phil Balagtas, founder of the Design Futures Initiative and the global Speculative Futures network, shows you how designers and futurists have made futures work at companies such as Atari, IBM, Apple, Disney, Autodesk, Luf...(148.10 zł najniższa cena z 30 dni)
148.00 zł
179.00 zł(-17%) -
Augmented Analytics isn't just another book on data and analytics; it's a holistic resource for reimagining the way your entire organization interacts with information to become insight-driven.Moving beyond traditional, limited ways of making sense of data, Augmented Analytics provides a dynamic,...(174.74 zł najniższa cena z 30 dni)
174.54 zł
219.00 zł(-20%) -
Learn how to prepare for—and pass—the Kubernetes and Cloud Native Associate (KCNA) certification exam. This practical guide serves as both a study guide and point of entry for practitioners looking to explore and adopt cloud native technologies. Adrián González Sánchez ...
Kubernetes and Cloud Native Associate (KCNA) Study Guide Kubernetes and Cloud Native Associate (KCNA) Study Guide
(169.14 zł najniższa cena z 30 dni)177.65 zł
199.00 zł(-11%) -
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(140.34 zł najniższa cena z 30 dni)
140.14 zł
179.00 zł(-22%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
![Loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
![ajax-loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
Oceny i opinie klientów: Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition Peter Bruce, Andrew Bruce, Peter Gedeck (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.