- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 256
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Data Science: The Hard Parts
This practical guide provides a collection of techniques and best practices that are generally overlooked in most data engineering and data science pedagogy. A common misconception is that great data scientists are experts in the "big themes" of the discipline—machine learning and programming. But most of the time, these tools can only take us so far. In practice, the smaller tools and skills really separate a great data scientist from a not-so-great one.
Taken as a whole, the lessons in this book make the difference between an average data scientist candidate and a qualified data scientist working in the field. Author Daniel Vaughan has collected, extended, and used these skills to create value and train data scientists from different companies and industries.
With this book, you will:
- Understand how data science creates value
- Deliver compelling narratives to sell your data science project
- Build a business case using unit economics principles
- Create new features for a ML model using storytelling
- Learn how to decompose KPIs
- Perform growth decompositions to find root causes for changes in a metric
Daniel Vaughan is head of data at Clip, the leading paytech company in Mexico. He's the author of Analytical Skills for AI and Data Science (O'Reilly).
Wybrane bestsellery
-
Oto praktyczny przewodnik po wypróbowanej kompleksowej metodzie ułatwiającej przekładanie decyzji biznesowych na łatwe w realizacji, normatywne rozwiązania, oparte na danych i sztucznej inteligencji. Badacze danych, analitycy i menedżerowie znajdą tu techniki ułatwiające zadawanie właściwych pyta...
Umiejętności analityczne w pracy z danymi i sztuczną inteligencją. Wykorzystywanie najnowszych technologii w rozwijaniu przedsiębiorstwa Umiejętności analityczne w pracy z danymi i sztuczną inteligencją. Wykorzystywanie najnowszych technologii w rozwijaniu przedsiębiorstwa
(38.35 zł najniższa cena z 30 dni)41.30 zł
59.00 zł(-30%) -
While several market-leading companies have successfully transformed their business models by following data- and AI-driven paths, the vast majority have yet to reap the benefits. How can your business and analytics units gain a competitive advantage by capturing the full potential of this predic...
Analytical Skills for AI and Data Science. Building Skills for an AI-Driven Enterprise Analytical Skills for AI and Data Science. Building Skills for an AI-Driven Enterprise
(211.65 zł najniższa cena z 30 dni)211.65 zł
249.00 zł(-15%) -
Cloud native development gives you the power to rapidly build, secure, and scale software. But you still need to navigate many potential pitfalls along the way. Through practical examples, this book demonstrates how to use Google Cloud as a laboratory to enable rapid innovation, a factory to auto...(203.15 zł najniższa cena z 30 dni)
203.15 zł
239.00 zł(-15%) -
Mastering Data transformation is essential for enhancing their data models and business intelligence. The Definitive Guide to Power Query equips you with the knowledge and skills to master the tool while leveraging its remarkable capabilities.
The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query
Gregory Deckler, Rick de Groot, Melissa de Korte, Brian Julius
-
Jeśli w swojej pracy masz lub miewasz do czynienia z danymi, z pewnością orientujesz się, że do tego celu stworzono dotąd całkiem sporo narzędzi. Nic dziwnego – przy tej liczbie danych, z jaką spotykamy się w dzisiejszym cyfrowym świecie, zdolność do ich sprawnego analizowania i wyciągania ...
Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym
(39.90 zł najniższa cena z 30 dni)62.55 zł
139.00 zł(-55%) -
Dzisiejszą gospodarką rządzi informacja. Kto potrafi ją wyłuskać z zalewu danych, ten zyskuje konkurencyjną przewagę. Świadomi tego twórcy oprogramowania komputerowego stworzyli szereg narzędzi służących wyszukiwaniu informacji, ich przetwarzaniu, analizowaniu i prezentowaniu w sposób dostępny dl...
Elasticsearch. Kurs video. Pozyskiwanie i analiza danych Elasticsearch. Kurs video. Pozyskiwanie i analiza danych
(99.59 zł najniższa cena z 30 dni)161.84 zł
249.00 zł(-35%) -
Power Apps to platforma stworzona przez Microsoft, umożliwiająca łatwe projektowanie, tworzenie i dostosowywanie aplikacji bez konieczności posiadania głębokiej wiedzy programistycznej. Z użyciem Power Apps można budować niestandardowe aplikacje, które efektywnie wspierają i automatyzują różne pr...
Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code
(69.65 zł najniższa cena z 30 dni)129.35 zł
199.00 zł(-35%) -
Tę książkę docenią wszyscy zainteresowani eksploracją danych i uczeniem maszynowym, którzy chcieliby pewnie poruszać się w świecie nauki o danych. Pokazano tu, w jaki sposób Excel pozwala zobrazować proces ich eksplorowania i jak działają poszczególne techniki w tym zakresie. Przejrzyście wyjaśni...
Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku
(43.55 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
Oto zwięzłe i równocześnie praktyczne kompendium, w którym znajdziesz 20 praktyk udanego planowania, analizy, specyfikacji, walidacji i zarządzania wymaganiami. Praktyki te są odpowiednie dla projektów zarządzanych zarówno w tradycyjny, jak i zwinny sposób, niezależnie od branży. Sprawią, że zesp...
Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej
(46.90 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
W dzisiejszej praktyce biznesowej duże znaczenie mają dane i ich analiza. W analizie zastosowanie znajduje wiele modeli statystycznych, implementowanych w różnych programach komputerowych. Na przykład Excel ma specjalny dodatek, nazwany po prostu Analiza Danych. Bardzo popularne narzędzie stanowi...
R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych
(67.05 zł najniższa cena z 30 dni)96.85 zł
149.00 zł(-35%)
O autorze ebooka
Dr Daniel Vaughan od piętnastu lat zajmuje się rozwiązywaniem problemów przy użyciu metod predykcyjnych i normatywnych. Obecnie prowadzi dział data science w Airbnb w Ameryce Łacińskiej. Wcześniej był dyrektorem do spraw danych i kierownikiem działu data science w Telefónica México.
Ebooka "Data Science: The Hard Parts" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Data Science: The Hard Parts" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Data Science: The Hard Parts" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-4643-6, 9781098146436
- Data wydania ebooka:
- 2023-11-01 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 5.5MB
- Rozmiar pliku Mobi:
- 9.3MB
Spis treści ebooka
- Preface
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- I. Data Analytics Techniques
- 1. So What? Creating Value with Data Science
- What Is Value?
- What: Understanding the Business
- So What: The Gist of Value Creation in DS
- Now What: Be a Go-Getter
- Measuring Value
- Key Takeaways
- Further Reading
- 2. Metrics Design
- Desirable Properties That Metrics Should Have
- Measurable
- Actionable
- Relevance
- Timeliness
- Desirable Properties That Metrics Should Have
- Metrics Decomposition
- Funnel Analytics
- Stock-Flow Decompositions
- P×Q-Type Decompositions
- Example: Another Revenue Decomposition
- Example: Marketplaces
- Key Takeaways
- Further Reading
- 3. Growth Decompositions: Understanding Tailwinds and Headwinds
- Why Growth Decompositions?
- Additive Decomposition
- Example
- Interpretation and Use Cases
- Multiplicative Decomposition
- Example
- Interpretation
- Mix-Rate Decompositions
- Example
- Interpretation
- Mathematical Derivations
- Additive Decomposition
- Multiplicative Decomposition
- Mix-Rate Decomposition
- Key Takeaways
- Further Reading
- 4. 2×2 Designs
- The Case for Simplification
- Whats a 2×2 Design?
- Example: Test a Model and a New Feature
- Example: Understanding User Behavior
- Example: Credit Origination and Acceptance
- Example: Prioritizing Your Workflow
- Key Takeaways
- Further Reading
- 5. Building Business Cases
- Some Principles to Construct Business Cases
- Example: Proactive Retention Strategy
- Fraud Prevention
- Purchasing External Datasets
- Working on a Data Science Project
- Key Takeaways
- Further Reading
- 6. Whats in a Lift?
- Lifts Defined
- Example: Classifier Model
- Self-Selection and Survivorship Biases
- Other Use Cases for Lifts
- Key Takeaways
- Further Reading
- 7. Narratives
- Whats in a Narrative: Telling a Story with Your Data
- Clear and to the Point
- Credible
- Memorable
- Actionable
- Whats in a Narrative: Telling a Story with Your Data
- Building a Narrative
- Science as Storytelling
- What, So What, and Now What?
- What?
- So what?
- Now what?
- The Last Mile
- Writing TL;DRs
- Tips to Write Memorable TL;DRs
- Example: Writing a TL;DR for This Chapter
- Delivering Powerful Elevator Pitches
- Presenting Your Narrative
- Key Takeaways
- Further Reading
- 8. Datavis: Choosing the Right Plot
to Deliver a Message
- Some Useful and Not-So-Used Data Visualizations
- Bar Versus Line Plots
- Slopegraphs
- Waterfall Charts
- Scatterplot Smoothers
- Plotting Distributions
- Some Useful and Not-So-Used Data Visualizations
- General Recommendations
- Find the Right Datavis for Your Message
- Choose Your Colors Wisely
- Different Dimensions in a Plot
- Aim for a Large Enough Data-Ink Ratio
- Customization Versus Semiautomation
- Get the Font Size Right from the Beginning
- Interactive or Not
- Stay Simple
- Start by Explaining the Plot
- Key Takeaways
- Further Reading
- II. Machine Learning
- 9. Simulation and Bootstrapping
- Basics of Simulation
- Simulating a Linear Model and Linear Regression
- What Are Partial Dependence Plots?
- Omitted Variable Bias
- Simulating Classification Problems
- Latent Variable Models
- Comparing Different Algorithms
- Bootstrapping
- Key Takeaways
- Further Reading
- 10. Linear Regression: Going Back to Basics
- Whats in a Coefficient?
- The Frisch-Waugh-Lovell Theorem
- Why Should You Care About FWL?
- Confounders
- Additional Variables
- The Central Role of Variance in ML
- Key Takeaways
- Further Reading
- 11. Data Leakage
- What Is Data Leakage?
- Outcome Is Also a Feature
- A Function of the Outcome Is Itself a Feature
- Bad Controls
- Mislabeling of a Timestamp
- Multiple Datasets with Sloppy Time Aggregations
- Leakage of Other Information
- What Is Data Leakage?
- Detecting Data Leakage
- Complete Separation
- Windowing Methodology
- Choosing the Length of the Windows
- The Training Stage Mirrors the Scoring Stage
- Implementing the Windowing Methodology
- I Have Leakage: Now What?
- Key Takeaways
- Further Reading
- 12. Productionizing Models
- What Does Production Ready Mean?
- Batch Scores (Offline)
- Real-Time Model Objects
- What Does Production Ready Mean?
- Data and Model Drift
- Essential Steps in any Production Pipeline
- Get and Transform Data
- Validate Data
- Training and Scoring Stages
- Validate Model and Scores
- Deploy Model and Scores
- Key Takeaways
- Further Reading
- 13. Storytelling in Machine Learning
- A Holistic View of Storytelling in ML
- Ex Ante and Interim Storytelling
- Creating Hypotheses
- Predicting human behavior
- Predicting system behavior
- Predicting downstream metrics
- Creating Hypotheses
- Feature Engineering
- Ex Post Storytelling: Opening the Black Box
- Interpretability-Performance Trade-Off
- Linear Regression: Setting a Benchmark
- Feature Importance
- Heatmaps
- Partial Dependence Plots
- Accumulated Local Effects
- Key Takeaways
- Further Reading
- 14. From Prediction to Decisions
- Dissecting Decision Making
- Simple Decision Rules by Smart Thresholding
- Precision and Recall
- Example: Lead Generation
- Confusion Matrix Optimization
- Key Takeaways
- Further Reading
- 15. Incrementality: The Holy Grail of
Data Science?
- Defining Incrementality
- Causal Reasoning to Improve Prediction
- Causal Reasoning as a Differentiator
- Improved Decision Making
- Defining Incrementality
- Confounders and Colliders
- Selection Bias
- Unconfoundedness Assumption
- Breaking Selection Bias: Randomization
- Matching
- Machine Learning and Causal Inference
- Open Source Codebases
- Double Machine Learning
- Key Takeaways
- Further Reading
- 16. A/B Tests
- What Is an A/B Test?
- Decision Criterion
- Minimum Detectable Effects
- Choosing the Statistical Power, Level, and P
- Estimating the Variance of the Outcome
- Simulations
- Example: Conversion Rates
- Setting the MDE
- Hypotheses Backlog
- Metric
- Hypothesis
- Ranking
- Governance of Experiments
- Key Takeaways
- Further Reading
- 17. Large Language Models and the
Practice of Data Science
- The Current State of AI
- What Do Data Scientists Do?
- Evolving the Data Scientists Job Description
- Case Study: A/B Testing
- Case Study: Data Cleansing
- Case Study: Machine Learning
- LLMs and This Book
- Key Takeaways
- Further Reading
- Index
O'Reilly Media - inne książki
-
Software as a service (SaaS) is on the path to becoming the de facto model for building, delivering, and operating software solutions. Adopting a multi-tenant SaaS model requires builders to take on a broad range of new architecture, implementation, and operational challenges. How data is partiti...(237.15 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
Great engineers don't necessarily make great leaders—at least, not without a lot of work. Finding your path to becoming a strong leader is often fraught with challenges. It's not easy to figure out how to be strategic, successful, and considerate while also being firm. Whether you're on the...(126.65 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%) -
Data science happens in code. The ability to write reproducible, robust, scaleable code is key to a data science project's success—and is absolutely essential for those working with production code. This practical book bridges the gap between data science and software engineering,and clearl...(211.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
With the massive adoption of microservices, operators and developers face far more complexity in their applications today. Service meshes can help you manage this problem by providing a unified control plane to secure, manage, and monitor your entire network. This practical guide shows you how th...(203.15 zł najniższa cena z 30 dni)
203.15 zł
239.00 zł(-15%) -
Get practical advice on how to leverage AI development tools for all stages of code creation, including requirements, planning, design, coding, debugging, testing, and documentation. With this book, beginners and experienced developers alike will learn how to use a wide range of tools, from gener...(164.25 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Rust's popularity is growing, due in part to features like memory safety, type safety, and thread safety. But these same elements can also make learning Rust a challenge, even for experienced programmers. This practical guide helps you make the transition to writing idiomatic Rust—while als...(164.25 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Advance your Power BI skills by adding AI to your repertoire at a practice level. With this practical book, business-oriented software engineers and developers will learn the terminologies, practices, and strategy necessary to successfully incorporate AI into your business intelligence estate. Je...(211.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Microservices can be a very effective approach for delivering value to your organization and to your customers. If you get them right, microservices help you to move fast by making changes to small parts of your system hundreds of times a day. But if you get them wrong, microservices will just ma...(203.15 zł najniższa cena z 30 dni)
203.15 zł
239.00 zł(-15%) -
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(169.14 zł najniższa cena z 30 dni)
169.14 zł
199.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Data Science: The Hard Parts Daniel Vaughan (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.