Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning
![Język publikacji: angielski Język publikacji: angielski](https://static01.helion.com.pl/global/flagi/1.png)
- Autorzy:
- Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda
![Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda - okładka ebooka](https://static01.helion.com.pl/global/okladki/326x466/e_0vuf.png)
![Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda - tył okładki ebooka](https://static01.helion.com.pl/global/okladki-tyl/326x466/e_0vuf.png)
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 332
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning
From news and speeches to informal chatter on social media, natural language is one of the richest and most underutilized sources of data. Not only does it come in a constant stream, always changing and adapting in context; it also contains information that is not conveyed by traditional data sources. The key to unlocking natural language is through the creative application of text analytics. This practical book presents a data scientist’s approach to building language-aware products with applied machine learning.
You’ll learn robust, repeatable, and scalable techniques for text analysis with Python, including contextual and linguistic feature engineering, vectorization, classification, topic modeling, entity resolution, graph analysis, and visual steering. By the end of the book, you’ll be equipped with practical methods to solve any number of complex real-world problems.
- Preprocess and vectorize text into high-dimensional feature representations
- Perform document classification and topic modeling
- Steer the model selection process with visual diagnostics
- Extract key phrases, named entities, and graph structures to reason about data in text
- Build a dialog framework to enable chatbots and language-driven interaction
- Use Spark to scale processing power and neural networks to scale model complexity
Wybrane bestsellery
-
Ready to use statistical and machine-learning techniques across large data sets? This practical guide shows you why the Hadoop ecosystem is perfect for the job. Instead of deployment, operations, or software development usually associated with distributed computing, you’ll focus on particul...
Data Analytics with Hadoop. An Introduction for Data Scientists Data Analytics with Hadoop. An Introduction for Data Scientists
(77.13 zł najniższa cena z 30 dni)76.63 zł
94.99 zł(-19%) -
Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych...
Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym
(55.20 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Pytest – nowoczesny framework do uruchamiania testów automatycznych w języku Python. Można używać tej platformy do przeprowadzania testów jednostkowych, ale sprawdzi się świetnie także podczas konstruowania rozbudowanych testów wyższego poziomu (integracyjnych, end-to-end) dla całych aplika...
Pytest. Kurs video. Automatyzacja testów w Pythonie Pytest. Kurs video. Automatyzacja testów w Pythonie
(44.70 zł najniższa cena z 30 dni)96.85 zł
149.00 zł(-35%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Sposobów na naukę Pythona jest sporo i powstało na ten temat mnóstwo publikacji. Jeżeli ten wybór jest właśnie przed Tobą, rozważ naukę Pythona poprzez tworzenie prostych gier. Ich programowanie to nie tylko świetna zabawa, ale też doskonała metoda rozwijania umiejętności algorytmicznych, kreatyw...
Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm
(51.60 zł najniższa cena z 30 dni)64.50 zł
129.00 zł(-50%) -
To trzecie, zaktualizowane i uzupełnione wydanie bestsellerowego podręcznika programowania w Pythonie. Naukę rozpoczniesz od podstawowych koncepcji programowania. Poznasz takie pojęcia jak zmienne, listy, klasy i pętle, a następnie utrwalisz je dzięki praktycznym ćwiczeniom. Dowiesz się, jak zape...(71.40 zł najniższa cena z 30 dni)
83.30 zł
119.00 zł(-30%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(107.40 zł najniższa cena z 30 dni)125.30 zł
179.00 zł(-30%) -
Ta książka stanowi przystępne wprowadzenie do świata projektantów i budowniczych robotów. Dzięki niej dowiesz się, jak wybrać potrzebne podzespoły, jak je ze sobą połączyć i jak wykorzystywać poszczególne urządzenia wejścia i wyjścia. Posłużysz się w tym celu płytką Raspberry Pi i kompatybilnymi ...
Jak zaprogramować robota. Zastosowanie Raspberry Pi i Pythona w tworzeniu autonomicznych robotów. Wydanie II Jak zaprogramować robota. Zastosowanie Raspberry Pi i Pythona w tworzeniu autonomicznych robotów. Wydanie II
(59.40 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%) -
Fachowcy z branży IT, by dobrze wykonywać swoją pracę, muszą w niej zwykle używać od kilku do kilkunastu narzędzi. Z drugiej strony nikt nie jest w stanie dobrze poznać nawet wycinka wszystkich technologii, języków programowania czy aplikacji, które powstają każdego roku. Czy wśród tego bogactwa,...
Receptura na Python. Kurs Video. 54 praktyczne porady dla programistów Receptura na Python. Kurs Video. 54 praktyczne porady dla programistów
(39.90 zł najniższa cena z 30 dni)129.35 zł
199.00 zł(-35%) -
Python to jeden z najpopularniejszych dynamicznych języków programowania. Nie od dziś znajduje on zastosowanie w różnych dziedzinach informatyki, zwłaszcza jako doskonały język skryptowy. Jeśli korzystasz z niego na co dzień i chcesz szybko wyszukiwać niezbędne informacje lub odświeżyć swoją wied...(8.49 zł najniższa cena z 30 dni)
9.35 zł
17.00 zł(-45%)
O autorach ebooka
Ebooka "Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-919-6299-2, 9781491962992
- Data wydania ebooka:
-
2018-06-11
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 10.8MB
- Rozmiar pliku Mobi:
- 24.2MB
Spis treści ebooka
- Preface
- Computational Challenges of Natural Language
- Linguistic Data: Tokens and Words
- Enter Machine Learning
- Computational Challenges of Natural Language
- Tools for Text Analysis
- What to Expect from This Book
- Who This Book Is For
- Code Examples and GitHub Repository
- Conventions Used in This Book
- Using Code Examples
- OReilly Safari
- How to Contact Us
- Acknowledgments
- 1. Language and Computation
- The Data Science Paradigm
- Language-Aware Data Products
- The Data Product Pipeline
- The model selection triple
- The Data Product Pipeline
- Language as Data
- A Computational Model of Language
- Language Features
- Contextual Features
- Structural Features
- Conclusion
- 2. Building a Custom Corpus
- What Is a Corpus?
- Domain-Specific Corpora
- The Baleen Ingestion Engine
- What Is a Corpus?
- Corpus Data Management
- Corpus Disk Structure
- The Baleen disk structure
- Corpus Disk Structure
- Corpus Readers
- Streaming Data Access with NLTK
- Reading an HTML Corpus
- Corpus monitoring
- Reading a Corpus from a Database
- Conclusion
- 3. Corpus Preprocessing and Wrangling
- Breaking Down Documents
- Identifying and Extracting Core Content
- Deconstructing Documents into Paragraphs
- Segmentation: Breaking Out Sentences
- Tokenization: Identifying Individual Tokens
- Part-of-Speech Tagging
- Intermediate Corpus Analytics
- Breaking Down Documents
- Corpus Transformation
- Intermediate Preprocessing and Storage
- Writing to pickle
- Intermediate Preprocessing and Storage
- Reading the Processed Corpus
- Conclusion
- 4. Text Vectorization and Transformation Pipelines
- Words in Space
- Frequency Vectors
- With NLTK
- In Scikit-Learn
- The Gensim way
- Frequency Vectors
- One-Hot Encoding
- With NLTK
- In Scikit-Learn
- The Gensim way
- Words in Space
- Term FrequencyInverse Document Frequency
- With NLTK
- In Scikit-Learn
- The Gensim way
- Distributed Representation
- The Gensim way
- The Scikit-Learn API
- The BaseEstimator Interface
- Extending TransformerMixin
- Creating a custom Gensim vectorization transformer
- Creating a custom text normalization transformer
- Pipelines
- Pipeline Basics
- Grid Search for Hyperparameter Optimization
- Enriching Feature Extraction with Feature Unions
- Conclusion
- 5. Classification for Text Analysis
- Text Classification
- Identifying Classification Problems
- Classifier Models
- Text Classification
- Building a Text Classification Application
- Cross-Validation
- Streaming access to k splits
- Cross-Validation
- Model Construction
- Model Evaluation
- Model Operationalization
- Conclusion
- 6. Clustering for Text Similarity
- Unsupervised Learning on Text
- Clustering by Document Similarity
- Distance Metrics
- Partitive Clustering
- k-means clustering
- Optimizing k-means
- Handling uneven geometries
- Hierarchical Clustering
- Agglomerative clustering
- Modeling Document Topics
- Latent Dirichlet Allocation
- In Scikit-Learn
- The Gensim way
- Visualizing topics
- Latent Dirichlet Allocation
- Latent Semantic Analysis
- In Scikit-Learn
- The Gensim way
- Non-Negative Matrix Factorization
- In Scikit-Learn
- Conclusion
- 7. Context-Aware Text Analysis
- Grammar-Based Feature Extraction
- Context-Free Grammars
- Syntactic Parsers
- Extracting Keyphrases
- Extracting Entities
- Grammar-Based Feature Extraction
- n-Gram Feature Extraction
- An n-Gram-Aware CorpusReader
- Choosing the Right n-Gram Window
- Significant Collocations
- n-Gram Language Models
- Frequency and Conditional Frequency
- Estimating Maximum Likelihood
- Unknown Words: Back-off and Smoothing
- Language Generation
- Conclusion
- 8. Text Visualization
- Visualizing Feature Space
- Visual Feature Analysis
- n-gram viewer
- Network visualization
- Co-occurrence plots
- Text x-rays and dispersion plots
- Visual Feature Analysis
- Guided Feature Engineering
- Part-of-speech tagging
- Most informative features
- Visualizing Feature Space
- Model Diagnostics
- Visualizing Clusters
- Visualizing Classes
- Diagnosing Classification Error
- Classification report heatmaps
- Confusion matrices
- Visual Steering
- Silhouette Scores and Elbow Curves
- Silhouette scores
- Elbow curves
- Silhouette Scores and Elbow Curves
- Conclusion
- 9. Graph Analysis of Text
- Graph Computation and Analysis
- Creating a Graph-Based Thesaurus
- Analyzing Graph Structure
- Visual Analysis of Graphs
- Graph Computation and Analysis
- Extracting Graphs from Text
- Creating a Social Graph
- Finding entity pairs
- Property graphs
- Implementing the graph extraction
- Creating a Social Graph
- Insights from the Social Graph
- Centrality
- Structural analysis
- Entity Resolution
- Entity Resolution on a Graph
- Blocking with Structure
- Fuzzy Blocking
- Conclusion
- 10. Chatbots
- Fundamentals of Conversation
- Dialog: A Brief Exchange
- Maintaining a Conversation
- Fundamentals of Conversation
- Rules for Polite Conversation
- Greetings and Salutations
- Handling Miscommunication
- Entertaining Questions
- Dependency Parsing
- Constituency Parsing
- Question Detection
- From Tablespoons to Grams
- Learning to Help
- Being Neighborly
- Offering Recommendations
- Conclusion
- 11. Scaling Text Analytics with Multiprocessing and Spark
- Python Multiprocessing
- Running Tasks in Parallel
- Process Pools and Queues
- Parallel Corpus Preprocessing
- Python Multiprocessing
- Cluster Computing with Spark
- Anatomy of a Spark Job
- Distributing the Corpus
- RDD Operations
- NLP with Spark
- From Scikit-Learn to MLLib
- Feature extraction
- Text clustering with MLLib
- Text classification with MLLib
- Local fit, global evaluation
- Conclusion
- 12. Deep Learning and Beyond
- Applied Neural Networks
- Neural Language Models
- Artificial Neural Networks
- Training a multilayer perceptron
- Artificial Neural Networks
- Deep Learning Architectures
- TensorFlow: A framework for deep learning
- Keras: An API for deep learning
- Sentiment Analysis
- Deep Structure Analysis
- Predicting sentiment with a bag-of-keyphrases
- Deep Structure Analysis
- The Future Is (Almost) Here
- Glossary
- Index
O'Reilly Media - inne książki
-
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(203.15 zł najniższa cena z 30 dni)
207.64 zł
239.00 zł(-13%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(237.15 zł najniższa cena z 30 dni)
249.75 zł
289.00 zł(-14%) -
Frontend developers have to consider many things: browser compatibility, usability, performance, scalability, SEO, and other best practices. But the most fundamental aspect of creating websites is one that often falls short: accessibility. Accessibility is the cornerstone of any website, and if a...(194.65 zł najniższa cena z 30 dni)
207.20 zł
239.00 zł(-13%) -
In this insightful and comprehensive guide, Addy Osmani shares more than a decade of experience working on the Chrome team at Google, uncovering secrets to engineering effectiveness, efficiency, and team success. Engineers and engineering leaders looking to scale their effectiveness and drive tra...(118.15 zł najniższa cena z 30 dni)
121.29 zł
149.00 zł(-19%) -
Data modeling is the single most overlooked feature in Power BI Desktop, yet it's what sets Power BI apart from other tools on the market. This practical book serves as your fast-forward button for data modeling with Power BI, Analysis Services tabular, and SQL databases. It serves as a starting ...(194.65 zł najniższa cena z 30 dni)
206.44 zł
239.00 zł(-14%) -
C# is undeniably one of the most versatile programming languages available to engineers today. With this comprehensive guide, you'll learn just how powerful the combination of C# and .NET can be. Author Ian Griffiths guides you through C# 12.0 and .NET 8 fundamentals and techniques for building c...(228.65 zł najniższa cena z 30 dni)
249.84 zł
289.00 zł(-14%) -
Learn how to get started with Futures Thinking. With this practical guide, Phil Balagtas, founder of the Design Futures Initiative and the global Speculative Futures network, shows you how designers and futurists have made futures work at companies such as Atari, IBM, Apple, Disney, Autodesk, Luf...(152.15 zł najniższa cena z 30 dni)
155.30 zł
179.00 zł(-13%) -
Augmented Analytics isn't just another book on data and analytics; it's a holistic resource for reimagining the way your entire organization interacts with information to become insight-driven.Moving beyond traditional, limited ways of making sense of data, Augmented Analytics provides a dynamic,...(181.25 zł najniższa cena z 30 dni)
181.15 zł
219.00 zł(-17%) -
Learn how to prepare for—and pass—the Kubernetes and Cloud Native Associate (KCNA) certification exam. This practical guide serves as both a study guide and point of entry for practitioners looking to explore and adopt cloud native technologies. Adrián González Sánchez ...
Kubernetes and Cloud Native Associate (KCNA) Study Guide Kubernetes and Cloud Native Associate (KCNA) Study Guide
(169.14 zł najniższa cena z 30 dni)177.65 zł
209.00 zł(-15%) -
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(148.67 zł najniższa cena z 30 dni)
148.56 zł
179.00 zł(-17%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
![Loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
![ajax-loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
Oceny i opinie klientów: Applied Text Analysis with Python. Enabling Language-Aware Data Products with Machine Learning Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.