Opis ebooka: SQL for Data Analysis
With the explosion of data, computing power, and cloud data warehouses, SQL has become an even more indispensable tool for the savvy analyst or data scientist. This practical book reveals new and hidden ways to improve your SQL skills, solve problems, and make the most of SQL as part of your workflow.
You'll learn how to use both common and exotic SQL functions such as joins, window functions, subqueries, and regular expressions in new, innovative ways--as well as how to combine SQL techniques to accomplish your goals faster, with understandable code. If you work with SQL databases, this is a must-have reference.
- Learn the key steps for preparing your data for analysis
- Perform time series analysis using SQL's date and time manipulations
- Use cohort analysis to investigate how groups change over time
- Use SQL's powerful functions and operators for text analysis
- Detect outliers in your data and replace them with alternate values
- Establish causality using experiment analysis, also known as A/B testing
Wybrane bestsellery
-
Cathy Tanimura jest analityczką danych z ponad dwudziestoletnim doświadczeniem. Odnosiła również sukcesy, budując zespoły do spraw analizy danych i tworząc potrzebną infrastrukturę. Zajmowała się także zarządzaniem zespołami w kilku czołowych firmach technologicznych. Od wielu lat używa języka SQ...(41.40 zł najniższa cena z 30 dni)
41.40 zł
69.00 zł(-40%) -
W świecie przepełnionym informacjami doskonała baza danych, która pozwala na ich zbieranie, organizowanie i zarządzanie nimi, to podstawa sprawnego funkcjonowania każdego przedsiębiorstwa. W tej branży od lat prym wiedzie relacyjna baza danych Oracle. Jednak aby efektywnie korzystać z jej dobrodz...(39.59 zł najniższa cena z 30 dni)
69.30 zł
99.00 zł(-30%) -
Jeśli myślisz o karierze analityka danych albo starasz się o pracę na stanowisku, na którym będziesz analizować dane, ten kurs jest specjalnie dla Ciebie. Opanujesz dzięki niemu między innymi niezbędne podstawy języka SQL i dowiesz się, jak funkcjonuje i do czego może Ci posłużyć system zarządzan...(99.59 zł najniższa cena z 30 dni)
174.30 zł
249.00 zł(-30%) -
Ludzkość od zarania dziejów miała potrzebę zapisywania i porządkowania danych – pierwsze tabliczki gliniane z zapisanymi informacjami handlowymi pochodzą z 3500 roku p.n.e. Na przestrzeni wieków pojawiło się wiele technik gromadzenia danych, jednak dopiero wraz z rozwojem technologii komput...(41.65 zł najniższa cena z 30 dni)
71.40 zł
119.00 zł(-40%) -
Firmy z branży IT prześcigają się w tworzeniu rozwiązań zwiększających wydajność pracy, jak również podnoszących poziom specjalizacji pracowników w określonych dziedzinach. Od kilku już lat pozycja full stack developera, który wykonywał wszystkie prace programistyczne, jest wielką rzadkością. Obe...(63.60 zł najniższa cena z 30 dni)
55.65 zł
159.00 zł(-65%) -
With the shift from data warehouses to data lakes, data now lands in repositories before it's been transformed, enabling engineers to model raw data into clean, well-defined datasets. dbt (data build tool) helps you take data further. This practical book shows data analysts, data engineers, BI de...(188.08 zł najniższa cena z 30 dni)
188.03 zł
239.00 zł(-21%) -
If you were handed two different but related sets of data, what tools would you use to find the matches? What if all you had was SQL SELECT access to a database? In this practical book, author Jim Lehmer provides best practices, techniques, and tricks to help you import, clean, match, score, and ...(160.99 zł najniższa cena z 30 dni)
160.49 zł
209.00 zł(-23%) -
To help you on the path to becoming a Snowflake pro, this concise yet comprehensive guide reviews fundamentals and best practices for Snowflake's SQL and Scripting languages. Developers and data professionals will learn how to generate, modify, and query data in the Snowflake relational database ...(231.09 zł najniższa cena z 30 dni)
230.88 zł
279.00 zł(-17%) -
The Presto community has mushroomed since its origins at Facebook in 2012. But ramping up this open source distributed SQL query engine can be challenging even for the most experienced engineers. With this practical book, data engineers and architects, platform engineers, cloud engineers, and sof...(189.09 zł najniższa cena z 30 dni)
188.88 zł
239.00 zł(-21%) -
Ta książka stanowi świetne wprowadzenie do analizy danych. Dzięki niej nauczysz się korzystać z surowych danych, nawet jeśli nie masz odpowiedniego doświadczenia. Zaczniesz od formułowania hipotez i generowania statystyk opisowych, a następnie przystąpisz do pisania zapytań w języku SQL w celu ag...(65.40 zł najniższa cena z 30 dni)
65.40 zł
109.00 zł(-40%)
O autorze ebooka
Cathy Tanimura jest analityczką danych z ponad dwudziestoletnim doświadczeniem. Odnosiła również sukcesy, budując zespoły do spraw analizy danych i tworząc potrzebną infrastrukturę. Zajmowała się także zarządzaniem zespołami w kilku czołowych firmach technologicznych. Od wielu lat używa języka SQL do pracy z większością komercyjnych i otwartych baz danych.
Kup polskie wydanie:
Analiza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
- Autor:
- Cathy Tanimura
34,50 zł
69,00 zł
(34.50 zł najniższa cena z 30 dni)
Ebooka "SQL for Data Analysis" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "SQL for Data Analysis" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "SQL for Data Analysis" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-920-8873-8, 9781492088738
- Data wydania ebooka:
- 2021-09-09 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 6.7MB
- Rozmiar pliku Mobi:
- 12.6MB
Spis treści ebooka
- Preface
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- 1. Analysis with SQL
- What Is Data Analysis?
- Why SQL?
- What Is SQL?
- Benefits of SQL
- SQL Versus R or Python
- SQL as Part of the Data Analysis Workflow
- Database Types and How to Work with Them
- Row-Store Databases
- Column-Store Databases
- Other Types of Data Infrastructure
- Conclusion
- 2. Preparing Data for Analysis
- Types of Data
- Database Data Types
- Structured Versus Unstructured
- Quantitative Versus Qualitative Data
- First-, Second-, and Third-Party Data
- Sparse Data
- Types of Data
- SQL Query Structure
- Profiling: Distributions
- Histograms and Frequencies
- Binning
- n-Tiles
- Profiling: Data Quality
- Detecting Duplicates
- Deduplication with GROUP BY and DISTINCT
- Preparing: Data Cleaning
- Cleaning Data with CASE Transformations
- Type Conversions and Casting
- Dealing with Nulls: coalesce, nullif, nvl Functions
- Missing Data
- Preparing: Shaping Data
- For Which Output: BI, Visualization, Statistics, ML
- Pivoting with CASE Statements
- Unpivoting with UNION Statements
- pivot and unpivot Functions
- Conclusion
- 3. Time Series Analysis
- Date, Datetime, and Time Manipulations
- Time Zone Conversions
- Date and Timestamp Format Conversions
- Date Math
- Time Math
- Joining Data from Different Sources
- Date, Datetime, and Time Manipulations
- The Retail Sales Data Set
- Trending the Data
- Simple Trends
- Comparing Components
- Percent of Total Calculations
- Indexing to See Percent Change over Time
- Rolling Time Windows
- Calculating Rolling Time Windows
- Rolling Time Windows with Sparse Data
- Calculating Cumulative Values
- Analyzing with Seasonality
- Period-over-Period Comparisons: YoY and MoM
- Period-over-Period Comparisons: Same Month Versus Last Year
- Comparing to Multiple Prior Periods
- Conclusion
- 4. Cohort Analysis
- Cohorts: A Useful Analysis Framework
- The Legislators Data Set
- Retention
- SQL for a Basic Retention Curve
- Adjusting Time Series to Increase Retention Accuracy
- Cohorts Derived from the Time Series Itself
- Defining the Cohort from a Separate Table
- Dealing with Sparse Cohorts
- Defining Cohorts from Dates Other Than the First Date
- Related Cohort Analyses
- Survivorship
- Returnship, or Repeat Purchase Behavior
- Cumulative Calculations
- Cross-Section Analysis, Through a Cohort Lens
- Conclusion
- 5. Text Analysis
- Why Text Analysis with SQL?
- What Is Text Analysis?
- Why SQL Is a Good Choice for Text Analysis
- When SQL Is Not a Good Choice
- Why Text Analysis with SQL?
- The UFO Sightings Data Set
- Text Characteristics
- Text Parsing
- Text Transformations
- Finding Elements Within Larger Blocks of Text
- Wildcard Matches: LIKE, ILIKE
- Exact Matches: IN, NOT IN
- Regular Expressions
- Finding and replacing with regex
- Constructing and Reshaping Text
- Concatenation
- Reshaping Text
- Conclusion
- 6. Anomaly Detection
- Capabilities and Limits of SQL for Anomaly Detection
- The Data Set
- Detecting Outliers
- Sorting to Find Anomalies
- Calculating Percentiles and Standard Deviations to Find Anomalies
- Graphing to Find Anomalies Visually
- Forms of Anomalies
- Anomalous Values
- Anomalous Counts or Frequencies
- Anomalies from the Absence of Data
- Handling Anomalies
- Investigation
- Removal
- Replacement with Alternate Values
- Rescaling
- Conclusion
- 7. Experiment Analysis
- Strengths and Limits of Experiment Analysis with SQL
- The Data Set
- Types of Experiments
- Experiments with Binary Outcomes: The Chi-Squared Test
- Experiments with Continuous Outcomes: The t-Test
- Challenges with Experiments and Options for Rescuing Flawed Experiments
- Variant Assignment
- Outliers
- Time Boxing
- Repeated Exposure Experiments
- When Controlled Experiments Arent Possible: Alternative Analyses
- Pre-/Post-Analysis
- Natural Experiment Analysis
- Analysis of Populations Around a Threshold
- Conclusion
- 8. Creating Complex Data Sets for Analysis
- When to Use SQL for Complex Data Sets
- Advantages of Using SQL
- When to Build into ETL Instead
- When to Put Logic in Other Tools
- When to Use SQL for Complex Data Sets
- Code Organization
- Commenting
- Capitalization, Indentation, Parentheses, and Other Formatting Tricks
- Storing Code
- Organizing Computations
- Understanding Order of SQL Clause Evaluation
- Subqueries
- Temporary Tables
- Common Table Expressions
- grouping sets
- Managing Data Set Size and Privacy Concerns
- Sampling with %, mod
- Reducing Dimensionality
- PII and Data Privacy
- Conclusion
- 9. Conclusion
- Funnel Analysis
- Churn, Lapse, and Other Definitions of Departure
- Basket Analysis
- Resources
- Books and Blogs
- Data Sets
- Final Thoughts
- Index
O'Reilly Media - inne książki
-
This concise yet comprehensive guide explains how to adopt a data lakehouse architecture to implement modern data platforms. It reviews the design considerations, challenges, and best practices for implementing a lakehouse and provides key insights into the ways that using a lakehouse can impact ...(193.69 zł najniższa cena z 30 dni)
193.19 zł
249.00 zł(-22%) -
In today's fast-paced world, more and more organizations require rapid application development with reduced development costs and increased productivity. This practical guide shows application developers how to use PowerApps, Microsoft's no-code/low-code application framework that helps developer...(162.47 zł najniższa cena z 30 dni)
162.27 zł
209.00 zł(-22%) -
Welcome to the systems age, where software professionals are no longer building software&emdash;we're building systems of software. Change is continuously deployed across software ecosystems coordinated by responsive infrastructure. In this world of increasing relational complexity, we need t...(152.21 zł najniższa cena z 30 dni)
152.01 zł
209.00 zł(-27%) -
This book provides an ideal guide for Python developers who want to learn how to build applications with large language models. Authors Olivier Caelen and Marie-Alice Blete cover the main features and benefits of GPT-4 and GPT-3.5 models and explain how they work. You'll also get a step-by-step g...(155.41 zł najniższa cena z 30 dni)
155.36 zł
209.00 zł(-26%) -
In today's cloud native world, where we automate as much as possible, everything is code. With this practical guide, you'll learn how Policy as Code (PaC) provides the means to manage the policies, related data, and responses to events that occur within the systems we maintain—Kubernetes, c...(212.59 zł najniższa cena z 30 dni)
212.39 zł
279.00 zł(-24%) -
Geared to intermediate- to advanced-level DBAs and IT professionals looking to enhance their MySQL skills, this guide provides a comprehensive overview on how to manage and optimize MySQL databases. You'll learn how to create databases and implement backup and recovery, security configurations, h...(221.43 zł najniższa cena z 30 dni)
221.33 zł
279.00 zł(-21%) -
Get the details, examples, and best practices you need to build generative AI applications, services, and solutions using the power of Azure OpenAI Service. With this comprehensive guide, Microsoft AI specialist Adrián González Sánchez examines the integration and utilization of Az...(162.23 zł najniższa cena z 30 dni)
162.18 zł
209.00 zł(-22%) -
Despite the increase of high-profile hacks, record-breaking data leaks, and ransomware attacks, many organizations don't have the budget for an information security (InfoSec) program. If you're forced to protect yourself by improvising on the job, this pragmatic guide provides a security-101 hand...(214.77 zł najniższa cena z 30 dni)
214.57 zł
239.00 zł(-10%) -
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(189.29 zł najniższa cena z 30 dni)
188.79 zł
239.00 zł(-21%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(227.19 zł najniższa cena z 30 dni)
227.14 zł
279.00 zł(-19%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: SQL for Data Analysis Cathy Tanimura (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.