Data Science at the Command Line. 2nd Edition
- Autor:
- Jeroen Janssens
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 282
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Data Science at the Command Line. 2nd Edition
This thoroughly revised guide demonstrates how the flexibility of the command line can help you become a more efficient and productive data scientist. You'll learn how to combine small yet powerful command-line tools to quickly obtain, scrub, explore, and model your data. To get you started, author Jeroen Janssens provides a Docker image packed with over 80 tools--useful whether you work with Windows, macOS, or Linux.
You'll quickly discover why the command line is an agile, scalable, and extensible technology. Even if you're comfortable processing data with Python or R, you'll learn how to greatly improve your data science workflow by leveraging the command line's power. This book is ideal for data scientists, analysts, and engineers; software and machine learning engineers; and system administrators.
- Obtain data from websites, APIs, databases, and spreadsheets
- Perform scrub operations on text, CSV, HTM, XML, and JSON files
- Explore data, compute descriptive statistics, and create visualizations
- Manage your data science workflow
- Create reusable command-line tools from one-liners and existing Python or R code
- Parallelize and distribute data-intensive pipelines
- Model data with dimensionality reduction, clustering, regression, and classification algorithms
Wybrane bestsellery
-
Oto kompleksowe omówienie sposobów wdrażania najnowszych dostępnych środków zabezpieczających systemy linuksowe. Z książki dowiesz się, jak skonfigurować laboratorium do ćwiczeń praktycznych, tworzyć konta użytkowników z odpowiednimi poziomami uprawnień, chronić dane dzięki uprawnieniom i szyfrow...
Bezpieczeństwo systemu Linux. Hardening i najnowsze techniki zabezpieczania przed cyberatakami. Wydanie III Bezpieczeństwo systemu Linux. Hardening i najnowsze techniki zabezpieczania przed cyberatakami. Wydanie III
(77.40 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
Ta książka pomoże Ci w doskonaleniu umiejętności potrzebnych na każdym etapie dochodzenia cyfrowego, od zbierania dowodów, poprzez ich analizę, po tworzenie raportów. Dzięki wielu wskazówkom i praktycznym ćwiczeniom przyswoisz techniki analizy, ekstrakcji danych i raportowania przy użyciu zaawans...
Informatyka śledcza i Kali Linux. Przeprowadź analizy nośników pamięci, ruchu sieciowego i zawartości RAM-u za pomocą narzędzi systemu Kali Linux 2022.x. Wydanie III Informatyka śledcza i Kali Linux. Przeprowadź analizy nośników pamięci, ruchu sieciowego i zawartości RAM-u za pomocą narzędzi systemu Kali Linux 2022.x. Wydanie III
(59.40 zł najniższa cena z 30 dni)64.35 zł
99.00 zł(-35%) -
Czy chcesz odkryć świat kodowania i stać się młodym programistą w zaledwie jeden dzień? Czy chcesz nauczyć się języka, który otworzy przed tobą drzwi do fascynującego świata technologii? Czy chcesz tworzyć własne gry, aplikacje i nie tylko, korzystając z Pythona, jednego z najbardziej przyjaz...
Python w 1 dzień dla najmłodszych. Naucz się kodowania w Pythonie w 12 godzin Python w 1 dzień dla najmłodszych. Naucz się kodowania w Pythonie w 12 godzin
-
Oto uzupełnione i zaktualizowane wydanie bestsellerowego przewodnika dla inżynierów sieci. Dzięki niemu przejdziesz trudną (ale ekscytującą!) drogę od tradycyjnej platformy do platformy sieciowej opartej na najlepszych praktykach programistycznych. Zaczniesz od zagadnień podstawowych, aby następn...
Zaawansowana inżynieria sieci w Pythonie. Automatyzacja, monitorowanie i zarządzanie chmurą. Wydanie IV Zaawansowana inżynieria sieci w Pythonie. Automatyzacja, monitorowanie i zarządzanie chmurą. Wydanie IV
(77.40 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywisteg...
Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
(65.40 zł najniższa cena z 30 dni)70.85 zł
109.00 zł(-35%) -
Zanurz się w fascynujący świat programowania w języku Python i osiągnij imponujący poziom umiejętności w zaledwie 24 godziny! Oto kilka zalet, które sprawiają, że ta książka jest niezbędna dla każdego aspirującego programisty: Szybki start: podstawy Pythona już w pierwszych godzinach nauki ...
Python w 1 dzień. Nauka programowania w Pythonie w 24 godziny od A do Z Python w 1 dzień. Nauka programowania w Pythonie w 24 godziny od A do Z
-
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...
Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie
(46.20 zł najniższa cena z 30 dni)50.05 zł
77.00 zł(-35%) -
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięk...
Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II
(77.40 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
To trzecie, zaktualizowane i uzupełnione wydanie bestsellerowego podręcznika programowania w Pythonie. Naukę rozpoczniesz od podstawowych koncepcji programowania. Poznasz takie pojęcia jak zmienne, listy, klasy i pętle, a następnie utrwalisz je dzięki praktycznym ćwiczeniom. Dowiesz się, jak zape...(71.40 zł najniższa cena z 30 dni)
77.35 zł
119.00 zł(-35%) -
Django służy do tworzenia aplikacji internetowych w Pythonie. Pozwala w pełni skorzystać z zalet tego języka, a przy tym jest łatwy do nauki. Praca z Django jest atrakcyjna dla programistów o różnym stopniu zaawansowania, co potwierdzają badania ankietowe serwisu Stack Overflow. Aby...
Django 4. Praktyczne tworzenie aplikacji sieciowych. Wydanie IV Django 4. Praktyczne tworzenie aplikacji sieciowych. Wydanie IV
(77.40 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%)
Ebooka "Data Science at the Command Line. 2nd Edition" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Data Science at the Command Line. 2nd Edition" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Data Science at the Command Line. 2nd Edition" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-920-8786-1, 9781492087861
- Data wydania ebooka:
- 2021-08-17 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 5.0MB
- Rozmiar pliku Mobi:
- 9.5MB
Spis treści ebooka
- Foreword
- Preface
- What to Expect from This Book
- Changes for the Second Edition
- How to Read This Book
- Who This Book Is For
- Conventions Used in This Book
- OReilly Online Learning
- How to Contact Us
- Acknowledgments for the Second Edition (2021)
- Acknowledgments for the First Edition (2014)
- 1. Introduction
- Data Science Is OSEMN
- Obtaining Data
- Scrubbing Data
- Exploring Data
- Modeling Data
- Interpreting Data
- Data Science Is OSEMN
- Intermezzo Chapters
- What Is the Command Line?
- Why Data Science at the Command Line?
- The Command Line Is Agile
- The Command Line Is Augmenting
- The Command Line Is Scalable
- The Command Line Is Extensible
- The Command Line Is Ubiquitous
- Summary
- For Further Exploration
- 2. Getting Started
- Getting the Data
- Installing the Docker Image
- Essential Unix Concepts
- The Environment
- Executing a Command-Line Tool
- Five Types of Command-Line Tools
- Combining Command-Line Tools
- Redirecting Input and Output
- Working with Files and Directories
- Managing Output
- Help!
- Summary
- For Further Exploration
- 3. Obtaining Data
- Overview
- Copying Local Files to the Docker Container
- Downloading from the Internet
- Introducing curl
- Saving
- Other Protocols
- Following Redirects
- Decompressing Files
- Converting Microsoft Excel Spreadsheets to CSV
- Querying Relational Databases
- Calling Web APIs
- Authentication
- Streaming APIs
- Summary
- For Further Exploration
- 4. Creating Command-Line Tools
- Overview
- Converting One-Liners into Shell Scripts
- Step 1: Create a File
- Step 2: Give Permission to Execute
- Step 3: Define a Shebang
- Step 4: Remove the Fixed Input
- Step 5: Add Arguments
- Step 6: Extend Your PATH
- Creating Command-Line Tools with Python and R
- Porting the Shell Script
- Processing Streaming Data from Standard Input
- Summary
- For Further Exploration
- 5. Scrubbing Data
- Overview
- Transformations, Transformations Everywhere
- Plain Text
- Filtering Lines
- Based on location
- Based on a pattern
- Based on randomness
- Filtering Lines
- Extracting Values
- Replacing and Deleting Values
- CSV
- Bodies and Headers and Columns, Oh My!
- Performing SQL Queries on CSV
- Extracting and Reordering Columns
- Filtering Rows
- Merging Columns
- Combining Multiple CSV Files
- Concatenate horizontally
- Joining
- Working with XML/HTML and JSON
- Summary
- For Further Exploration
- 6. Project Management with Make
- Overview
- Introducing Make
- Running Tasks
- Building, for Real
- Adding Dependencies
- Summary
- For Further Exploration
- 7. Exploring Data
- Overview
- Inspecting Data and Its Properties
- Header or Not, Here I Come
- Inspect All the Data
- Feature Names and Data Types
- Unique Identifiers, Continuous Variables, and Factors
- Computing Descriptive Statistics
- Column Statistics
- R One-Liners on the Shell
- Creating Visualizations
- Displaying Images from the Command Line
- Plotting in a Rush
- Creating Bar Charts
- Creating Histograms
- Creating Density Plots
- Happy Little Accidents
- Creating Scatter Plots
- Creating Trend Lines
- Creating Box Plots
- Adding Labels
- Going Beyond Basic Plots
- Summary
- For Further Exploration
- 8. Parallel Pipelines
- Overview
- Serial Processing
- Looping Over Numbers
- Looping Over Lines
- Looping Over Files
- Parallel Processing
- Introducing GNU Parallel
- Specifying Input
- Controlling the Number of Concurrent Jobs
- Logging and Output
- Creating Parallel Tools
- Distributed Processing
- Get List of Running AWS EC2 Instances
- Running Commands on Remote Machines
- Distributing Local Data Among Remote Machines
- Processing Files on Remote Machines
- Summary
- For Further Exploration
- 9. Modeling Data
- Overview
- More Wine, Please!
- Dimensionality Reduction with Tapkee
- Introducing Tapkee
- Linear and Nonlinear Mappings
- Regression with Vowpal Wabbit
- Preparing the Data
- Training the Model
- Testing the Model
- Classification with SciKit-Learn Laboratory
- Preparing the Data
- Running the Experiment
- Parsing the Results
- Summary
- For Further Exploration
- 10. Polyglot Data Science
- Overview
- Jupyter
- Python
- R
- RStudio
- Apache Spark
- Summary
- For Further Exploration
- 11. Conclusion
- Lets Recap
- Three Pieces of Advice
- Be Patient
- Be Creative
- Be Practical
- Where to Go from Here
- The Command Line
- Shell Programming
- Python, R, and SQL
- APIs
- Machine Learning
- Getting in Touch
- A. List of Command-Line Tools
- alias
- awk
- aws
- bash
- bat
- bc
- body
- cat
- cd
- chmod
- cols
- column
- cowsay
- cp
- csv2vw
- csvcut
- csvgrep
- csvjoin
- csvlook
- csvquote
- csvsort
- csvsql
- csvstack
- csvstat
- curl
- cut
- display
- dseq
- echo
- env
- export
- fc
- find
- fold
- for
- fx
- git
- grep
- gron
- head
- header
- history
- hostname
- in2csv
- jq
- json2csv
- l
- less
- ls
- make
- man
- mkdir
- mv
- nano
- nl
- parallel
- paste
- pbc
- pip
- pup
- pwd
- python
- R
- rev
- rm
- rush
- sample
- scp
- sed
- seq
- servewd
- shuf
- skll
- sort
- split
- sponge
- sql2csv
- ssh
- sudo
- tail
- tapkee
- tar
- tee
- telnet
- tldr
- tr
- tree
- trim
- ts
- type
- uniq
- unpack
- unrar
- unzip
- vw
- wc
- which
- xml2json
- xmlstarlet
- xsv
- zcat
- zsh
- Index
O'Reilly Media - inne książki
-
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(160.65 zł najniższa cena z 30 dni)
169.14 zł
199.00 zł(-15%) -
OpenTelemetry is a revolution in observability data. Instead of running multiple uncoordinated pipelines, OpenTelemetry provides users with a single integrated stream of data, providing multiple sources of high-quality telemetry data: tracing, metrics, logs, RUM, eBPF, and more. This practical gu...(143.65 zł najniższa cena z 30 dni)
143.65 zł
169.00 zł(-15%) -
Interested in developing embedded systems? Since they don't tolerate inefficiency, these systems require a disciplined approach to programming. This easy-to-read guide helps you cultivate good development practices based on classic software design patterns and new patterns unique to embedded prog...(152.15 zł najniższa cena z 30 dni)
160.65 zł
189.00 zł(-15%) -
If you use Linux in your day-to-day work, then Linux Pocket Guide is the perfect on-the-job reference. This thoroughly updated 20th anniversary edition explains more than 200 Linux commands, including new commands for file handling, package management, version control, file format conversions, an...(92.65 zł najniższa cena z 30 dni)
101.15 zł
119.00 zł(-15%) -
Gain the valuable skills and techniques you need to accelerate the delivery of machine learning solutions. With this practical guide, data scientists, ML engineers, and their leaders will learn how to bridge the gap between data science and Lean product delivery in a practical and simple way. Dav...(245.65 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
This practical book provides a detailed explanation of the zero trust security model. Zero trust is a security paradigm shift that eliminates the concept of traditional perimeter-based security and requires you to "always assume breach" and "never trust but always verify." The updated edition off...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Decentralized finance (DeFi) is a rapidly growing field in fintech, having grown from $700 million to $100 billion over the past three years alone. But the lack of reliable information makes this area both risky and murky. In this practical book, experienced securities attorney Alexandra Damsker ...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Whether you're a startup founder trying to disrupt an industry or an entrepreneur trying to provoke change from within, your biggest challenge is creating a product people actually want. Lean Analytics steers you in the right direction.This book shows you how to validate your initial idea, find t...(126.65 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%) -
When it comes to building user interfaces on the web, React enables web developers to unlock a new world of possibilities. This practical book helps you take a deep dive into fundamental concepts of this JavaScript library, including JSX syntax and advanced patterns, the virtual DOM, React reconc...(194.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Data Science at the Command Line. 2nd Edition Jeroen Janssens (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.