Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning
- Autorzy:
- Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 332
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning
From news and speeches to informal chatter on social media, natural language is one of the richest and most underutilized sources of data. Not only does it come in a constant stream, always changing and adapting in context; it also contains information that is not conveyed by traditional data sources. The key to unlocking natural language is through the creative application of text analytics. This practical book presents a data scientist’s approach to building language-aware products with applied machine learning.
You’ll learn robust, repeatable, and scalable techniques for text analysis with Python, including contextual and linguistic feature engineering, vectorization, classification, topic modeling, entity resolution, graph analysis, and visual steering. By the end of the book, you’ll be equipped with practical methods to solve any number of complex real-world problems.
- Preprocess and vectorize text into high-dimensional feature representations
- Perform document classification and topic modeling
- Steer the model selection process with visual diagnostics
- Extract key phrases, named entities, and graph structures to reason about data in text
- Build a dialog framework to enable chatbots and language-driven interaction
- Use Spark to scale processing power and neural networks to scale model complexity
Wybrane bestsellery
-
Ready to use statistical and machine-learning techniques across large data sets? This practical guide shows you why the Hadoop ecosystem is perfect for the job. Instead of deployment, operations, or software development usually associated with distributed computing, you’ll focus on particul...
Data Analytics with Hadoop. An Introduction for Data Scientists Data Analytics with Hadoop. An Introduction for Data Scientists
(80.73 zł najniższa cena z 30 dni)80.73 zł
94.99 zł(-15%) -
Czy chcesz odkryć świat kodowania i stać się młodym programistą w zaledwie jeden dzień? Czy chcesz nauczyć się języka, który otworzy przed tobą drzwi do fascynującego świata technologii? Czy chcesz tworzyć własne gry, aplikacje i nie tylko, korzystając z Pythona, jednego z najbardziej przyjaz...
Python w 1 dzień dla najmłodszych. Naucz się kodowania w Pythonie w 12 godzin Python w 1 dzień dla najmłodszych. Naucz się kodowania w Pythonie w 12 godzin
-
Oto uzupełnione i zaktualizowane wydanie bestsellerowego przewodnika dla inżynierów sieci. Dzięki niemu przejdziesz trudną (ale ekscytującą!) drogę od tradycyjnej platformy do platformy sieciowej opartej na najlepszych praktykach programistycznych. Zaczniesz od zagadnień podstawowych, aby następn...
Zaawansowana inżynieria sieci w Pythonie. Automatyzacja, monitorowanie i zarządzanie chmurą. Wydanie IV Zaawansowana inżynieria sieci w Pythonie. Automatyzacja, monitorowanie i zarządzanie chmurą. Wydanie IV
(77.40 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%) -
Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywisteg...
Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
(65.40 zł najniższa cena z 30 dni)76.30 zł
109.00 zł(-30%) -
Zanurz się w fascynujący świat programowania w języku Python i osiągnij imponujący poziom umiejętności w zaledwie 24 godziny! Oto kilka zalet, które sprawiają, że ta książka jest niezbędna dla każdego aspirującego programisty: Szybki start: podstawy Pythona już w pierwszych godzinach nauki ...
Python w 1 dzień. Nauka programowania w Pythonie w 24 godziny od A do Z Python w 1 dzień. Nauka programowania w Pythonie w 24 godziny od A do Z
-
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...
Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie
(46.20 zł najniższa cena z 30 dni)53.90 zł
77.00 zł(-30%) -
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięk...
Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II
(77.40 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%) -
To trzecie, zaktualizowane i uzupełnione wydanie bestsellerowego podręcznika programowania w Pythonie. Naukę rozpoczniesz od podstawowych koncepcji programowania. Poznasz takie pojęcia jak zmienne, listy, klasy i pętle, a następnie utrwalisz je dzięki praktycznym ćwiczeniom. Dowiesz się, jak zape...(71.40 zł najniższa cena z 30 dni)
83.30 zł
119.00 zł(-30%) -
Django służy do tworzenia aplikacji internetowych w Pythonie. Pozwala w pełni skorzystać z zalet tego języka, a przy tym jest łatwy do nauki. Praca z Django jest atrakcyjna dla programistów o różnym stopniu zaawansowania, co potwierdzają badania ankietowe serwisu Stack Overflow. Aby...
Django 4. Praktyczne tworzenie aplikacji sieciowych. Wydanie IV Django 4. Praktyczne tworzenie aplikacji sieciowych. Wydanie IV
(77.40 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%) -
Dzięki tej książce zrozumiesz, że w rekurencji nie kryje się żadna magia. Dowiesz się, na czym polega jej działanie i kiedy warto zastosować algorytm rekursywny, a kiedy lepiej tego nie robić. Poznasz szereg klasycznych i mniej znanych algorytmów rekurencyjnych. Pracę z zawartym tu materiałem uła...
Rekurencyjna książka o rekurencji. Zostań mistrzem rozmów kwalifikacyjnych poświęconych językom Python i JavaScript Rekurencyjna książka o rekurencji. Zostań mistrzem rozmów kwalifikacyjnych poświęconych językom Python i JavaScript
(47.40 zł najniższa cena z 30 dni)55.30 zł
79.00 zł(-30%)
Ebooka "Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-919-6299-2, 9781491962992
- Data wydania ebooka:
- 2018-06-11 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 10.8MB
- Rozmiar pliku Mobi:
- 24.2MB
Spis treści ebooka
- Preface
- Computational Challenges of Natural Language
- Linguistic Data: Tokens and Words
- Enter Machine Learning
- Computational Challenges of Natural Language
- Tools for Text Analysis
- What to Expect from This Book
- Who This Book Is For
- Code Examples and GitHub Repository
- Conventions Used in This Book
- Using Code Examples
- OReilly Safari
- How to Contact Us
- Acknowledgments
- 1. Language and Computation
- The Data Science Paradigm
- Language-Aware Data Products
- The Data Product Pipeline
- The model selection triple
- The Data Product Pipeline
- Language as Data
- A Computational Model of Language
- Language Features
- Contextual Features
- Structural Features
- Conclusion
- 2. Building a Custom Corpus
- What Is a Corpus?
- Domain-Specific Corpora
- The Baleen Ingestion Engine
- What Is a Corpus?
- Corpus Data Management
- Corpus Disk Structure
- The Baleen disk structure
- Corpus Disk Structure
- Corpus Readers
- Streaming Data Access with NLTK
- Reading an HTML Corpus
- Corpus monitoring
- Reading a Corpus from a Database
- Conclusion
- 3. Corpus Preprocessing and Wrangling
- Breaking Down Documents
- Identifying and Extracting Core Content
- Deconstructing Documents into Paragraphs
- Segmentation: Breaking Out Sentences
- Tokenization: Identifying Individual Tokens
- Part-of-Speech Tagging
- Intermediate Corpus Analytics
- Breaking Down Documents
- Corpus Transformation
- Intermediate Preprocessing and Storage
- Writing to pickle
- Intermediate Preprocessing and Storage
- Reading the Processed Corpus
- Conclusion
- 4. Text Vectorization and Transformation Pipelines
- Words in Space
- Frequency Vectors
- With NLTK
- In Scikit-Learn
- The Gensim way
- Frequency Vectors
- One-Hot Encoding
- With NLTK
- In Scikit-Learn
- The Gensim way
- Words in Space
- Term FrequencyInverse Document Frequency
- With NLTK
- In Scikit-Learn
- The Gensim way
- Distributed Representation
- The Gensim way
- The Scikit-Learn API
- The BaseEstimator Interface
- Extending TransformerMixin
- Creating a custom Gensim vectorization transformer
- Creating a custom text normalization transformer
- Pipelines
- Pipeline Basics
- Grid Search for Hyperparameter Optimization
- Enriching Feature Extraction with Feature Unions
- Conclusion
- 5. Classification for Text Analysis
- Text Classification
- Identifying Classification Problems
- Classifier Models
- Text Classification
- Building a Text Classification Application
- Cross-Validation
- Streaming access to k splits
- Cross-Validation
- Model Construction
- Model Evaluation
- Model Operationalization
- Conclusion
- 6. Clustering for Text Similarity
- Unsupervised Learning on Text
- Clustering by Document Similarity
- Distance Metrics
- Partitive Clustering
- k-means clustering
- Optimizing k-means
- Handling uneven geometries
- Hierarchical Clustering
- Agglomerative clustering
- Modeling Document Topics
- Latent Dirichlet Allocation
- In Scikit-Learn
- The Gensim way
- Visualizing topics
- Latent Dirichlet Allocation
- Latent Semantic Analysis
- In Scikit-Learn
- The Gensim way
- Non-Negative Matrix Factorization
- In Scikit-Learn
- Conclusion
- 7. Context-Aware Text Analysis
- Grammar-Based Feature Extraction
- Context-Free Grammars
- Syntactic Parsers
- Extracting Keyphrases
- Extracting Entities
- Grammar-Based Feature Extraction
- n-Gram Feature Extraction
- An n-Gram-Aware CorpusReader
- Choosing the Right n-Gram Window
- Significant Collocations
- n-Gram Language Models
- Frequency and Conditional Frequency
- Estimating Maximum Likelihood
- Unknown Words: Back-off and Smoothing
- Language Generation
- Conclusion
- 8. Text Visualization
- Visualizing Feature Space
- Visual Feature Analysis
- n-gram viewer
- Network visualization
- Co-occurrence plots
- Text x-rays and dispersion plots
- Visual Feature Analysis
- Guided Feature Engineering
- Part-of-speech tagging
- Most informative features
- Visualizing Feature Space
- Model Diagnostics
- Visualizing Clusters
- Visualizing Classes
- Diagnosing Classification Error
- Classification report heatmaps
- Confusion matrices
- Visual Steering
- Silhouette Scores and Elbow Curves
- Silhouette scores
- Elbow curves
- Silhouette Scores and Elbow Curves
- Conclusion
- 9. Graph Analysis of Text
- Graph Computation and Analysis
- Creating a Graph-Based Thesaurus
- Analyzing Graph Structure
- Visual Analysis of Graphs
- Graph Computation and Analysis
- Extracting Graphs from Text
- Creating a Social Graph
- Finding entity pairs
- Property graphs
- Implementing the graph extraction
- Creating a Social Graph
- Insights from the Social Graph
- Centrality
- Structural analysis
- Entity Resolution
- Entity Resolution on a Graph
- Blocking with Structure
- Fuzzy Blocking
- Conclusion
- 10. Chatbots
- Fundamentals of Conversation
- Dialog: A Brief Exchange
- Maintaining a Conversation
- Fundamentals of Conversation
- Rules for Polite Conversation
- Greetings and Salutations
- Handling Miscommunication
- Entertaining Questions
- Dependency Parsing
- Constituency Parsing
- Question Detection
- From Tablespoons to Grams
- Learning to Help
- Being Neighborly
- Offering Recommendations
- Conclusion
- 11. Scaling Text Analytics with Multiprocessing and Spark
- Python Multiprocessing
- Running Tasks in Parallel
- Process Pools and Queues
- Parallel Corpus Preprocessing
- Python Multiprocessing
- Cluster Computing with Spark
- Anatomy of a Spark Job
- Distributing the Corpus
- RDD Operations
- NLP with Spark
- From Scikit-Learn to MLLib
- Feature extraction
- Text clustering with MLLib
- Text classification with MLLib
- Local fit, global evaluation
- Conclusion
- 12. Deep Learning and Beyond
- Applied Neural Networks
- Neural Language Models
- Artificial Neural Networks
- Training a multilayer perceptron
- Artificial Neural Networks
- Deep Learning Architectures
- TensorFlow: A framework for deep learning
- Keras: An API for deep learning
- Sentiment Analysis
- Deep Structure Analysis
- Predicting sentiment with a bag-of-keyphrases
- Deep Structure Analysis
- The Future Is (Almost) Here
- Glossary
- Index
O'Reilly Media - inne książki
-
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(177.65 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(160.65 zł najniższa cena z 30 dni)
177.65 zł
209.00 zł(-15%) -
OpenTelemetry is a revolution in observability data. Instead of running multiple uncoordinated pipelines, OpenTelemetry provides users with a single integrated stream of data, providing multiple sources of high-quality telemetry data: tracing, metrics, logs, RUM, eBPF, and more. This practical gu...(143.65 zł najniższa cena z 30 dni)
152.15 zł
179.00 zł(-15%) -
Interested in developing embedded systems? Since they don't tolerate inefficiency, these systems require a disciplined approach to programming. This easy-to-read guide helps you cultivate good development practices based on classic software design patterns and new patterns unique to embedded prog...(152.15 zł najniższa cena z 30 dni)
160.65 zł
189.00 zł(-15%) -
If you use Linux in your day-to-day work, then Linux Pocket Guide is the perfect on-the-job reference. This thoroughly updated 20th anniversary edition explains more than 200 Linux commands, including new commands for file handling, package management, version control, file format conversions, an...(92.65 zł najniższa cena z 30 dni)
101.15 zł
119.00 zł(-15%) -
Gain the valuable skills and techniques you need to accelerate the delivery of machine learning solutions. With this practical guide, data scientists, ML engineers, and their leaders will learn how to bridge the gap between data science and Lean product delivery in a practical and simple way. Dav...(245.65 zł najniższa cena z 30 dni)
254.15 zł
299.00 zł(-15%) -
This practical book provides a detailed explanation of the zero trust security model. Zero trust is a security paradigm shift that eliminates the concept of traditional perimeter-based security and requires you to "always assume breach" and "never trust but always verify." The updated edition off...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Decentralized finance (DeFi) is a rapidly growing field in fintech, having grown from $700 million to $100 billion over the past three years alone. But the lack of reliable information makes this area both risky and murky. In this practical book, experienced securities attorney Alexandra Damsker ...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Whether you're a startup founder trying to disrupt an industry or an entrepreneur trying to provoke change from within, your biggest challenge is creating a product people actually want. Lean Analytics steers you in the right direction.This book shows you how to validate your initial idea, find t...(126.65 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%) -
When it comes to building user interfaces on the web, React enables web developers to unlock a new world of possibilities. This practical book helps you take a deep dive into fundamental concepts of this JavaScript library, including JSX syntax and advanced patterns, the virtual DOM, React reconc...(194.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.