Natural Language Processing with Spark NLP. Learning to Understand Text at Scale
- Autor:
- Alex Thomas
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 366
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Natural Language Processing with Spark NLP. Learning to Understand Text at Scale
If you want to build an enterprise-quality application that uses natural language text but aren’t sure where to begin or what tools to use, this practical guide will help get you started. Alex Thomas, principal data scientist at Wisecube, shows software engineers and data scientists how to build scalable natural language processing (NLP) applications using deep learning and the Apache Spark NLP library.
Through concrete examples, practical and theoretical explanations, and hands-on exercises for using NLP on the Spark processing framework, this book teaches you everything from basic linguistics and writing systems to sentiment analysis and search engines. You’ll also explore special concerns for developing text-based applications, such as performance.
In four sections, you’ll learn NLP basics and building blocks before diving into application and system building:
- Basics: Understand the fundamentals of natural language processing, NLP on Apache Stark, and deep learning
- Building blocks: Learn techniques for building NLP applications—including tokenization, sentence segmentation, and named-entity recognition—and discover how and why they work
- Applications: Explore the design, development, and experimentation process for building your own NLP applications
- Building NLP systems: Consider options for productionizing and deploying NLP models, including which human languages to support
Wybrane bestsellery
-
Tę książkę docenią praktycy: inżynierowie uczenia maszynowego i analitycy danych, poszukujący sposobu praktycznego zaadaptowania modeli transformacyjnych do swoich potrzeb. Autorzy skupili się na praktycznej stronie tworzenia aplikacji językowych, a w poszczególnych rozdziałach ujęto wszystkie na...
Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face
(59.40 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%) -
Czy zastanawiasz się czasem nad tym, jak to możliwe, że jesteśmy w stanie „rozmawiać” z maszynami? Że coś mówimy, a one nas rozumieją i odpowiadają na nasze pytania, realizują polecenia, wykonują zadania? I na odwrót – to one mówią (i piszą) do nas słowami, które są dla nas jasn...
NLP. Kurs video. Analiza danych tekstowych w języku Python NLP. Kurs video. Analiza danych tekstowych w języku Python
(39.90 zł najniższa cena z 30 dni)52.15 zł
149.00 zł(-65%) -
Nauka czytania w myślach nie jest tak szalonym pomysłem, jak mogłoby się wydawać. Podczas każdej interakcji wysyłamy szereg sygnałów niewerbalnych, często silniejszych niż wypowiadane przez nas słowa.
Sztuka czytania w myślach. Jak zrozumieć innych i wpływać na nich tak, by tego nie zauważyli Sztuka czytania w myślach. Jak zrozumieć innych i wpływać na nich tak, by tego nie zauważyli
(26.94 zł najniższa cena z 30 dni)26.94 zł
34.99 zł(-23%) -
Psychokompetencje to inaczej kompetencje miękkie. Należą do nich między innymi umiejętności: budowania relacji, komunikacyjne, negocjacyjne, myślenia kreatywnego i krytycznego, a także adaptacji do zmieniających się warunków czy rozwiązywania konfliktów. Bez ich opanowania trudno osiągnąć sukces ...
PSYCHOkompetencje. 10 psychologicznych supermocy, które warto rozwijać PSYCHOkompetencje. 10 psychologicznych supermocy, które warto rozwijać
(29.40 zł najniższa cena z 30 dni)34.30 zł
49.00 zł(-30%) -
Dzięki tej książce udoskonalisz swoje umiejętności komunikacyjne: nauczysz się odczytywać niewerbalne wskazówki i samemu prezentować niewerbalne wzmocnienia. Z jednej strony zaczniesz lepiej rozumieć przekaz innych ludzi, z drugiej — sprawisz, że rozmówcy zaczną cenić komunikowanie się z To...
Socjotechnika. Metody manipulacji i ludzki aspekt bezpieczeństwa Socjotechnika. Metody manipulacji i ludzki aspekt bezpieczeństwa
(29.40 zł najniższa cena z 30 dni)34.30 zł
49.00 zł(-30%) -
Już jako nastolatek swoimi umiejętnościami zastraszył całą Amerykę. Z czasem stał się najsłynniejszym hakerem świata i wrogiem publicznym numer jeden - okrzyknięty przez media groźnym cyberprzestępcą, gorliwie ścigany przez FBI, w końcu podstępem namierzony, osaczony i spektakularnie ujęty... Uzb...
Sztuka podstępu. Łamałem ludzi, nie hasła. Wydanie II Sztuka podstępu. Łamałem ludzi, nie hasła. Wydanie II
(32.94 zł najniższa cena z 30 dni)38.43 zł
54.90 zł(-30%) -
Programowanie neurolingwistyczne pozwala zrozumieć, co naprawdę motywuje nas do działania, jak myślimy, jak czujemy i jak rozumiemy to, co zachodzi wokół nas. Ta książka przystępnie wyjaśnia podstawy NLP i przedstawia praktyczne pomysły zastosowania go w życiu codziennym, aby rozwiązywać problemy...(41.40 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
Dobra wiadomość jest taka, że perswazji i odporności na nią można się nauczyć. Koniec z wywieraniem negatywnego wpływu na Twoje decyzje. Koniec z nieświadomym poddawaniem się manipulacji! To, że trzymasz w ręku tę książkę, oznacza, że już wykonałeś pierwszy krok. Kolejnym będzie poznanie zasad rz...
Podręcznik perswazji. Najskuteczniejsze metody przekonywania innych i świadomej ochrony przed manipulacją Podręcznik perswazji. Najskuteczniejsze metody przekonywania innych i świadomej ochrony przed manipulacją
(14.90 zł najniższa cena z 30 dni)19.95 zł
39.90 zł(-50%) -
Trzymasz w ręku wybór najciekawszych artykułów opublikowanych oryginalnie w Harward Business Review — prestiżowym miesięczniku wydawanym przez jeden z najznakomitszych uniwersytetów na świecie. Magazyn ten jest uważany za najbardziej opiniotwórczy w takich dziedzinach jak ekonomia, praktyki...
Przekonywanie i wywieranie wpływu. Inteligencja emocjonalna. Harvard Business Review Przekonywanie i wywieranie wpływu. Inteligencja emocjonalna. Harvard Business Review
(14.90 zł najniższa cena z 30 dni)19.95 zł
39.90 zł(-50%) -
Książka ta podsunie Ci narzędzia, które pomogą podnieść jakość Twojego życia oraz pokonać przeszkody uniemożliwiające Ci działanie, takie jak fobie, depresja, szkodliwe nawyki, choroby psychosomatyczne czy trudności w uczeniu się. Pozwolą Ci również przejąć większą kontrolę nad własnym życiem, zm...
NLP - najwyższy stopień wtajemniczenia, czyli jak budować własny sukces NLP - najwyższy stopień wtajemniczenia, czyli jak budować własny sukces
(9.90 zł najniższa cena z 30 dni)14.95 zł
29.90 zł(-50%)
Ebooka "Natural Language Processing with Spark NLP. Learning to Understand Text at Scale" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Natural Language Processing with Spark NLP. Learning to Understand Text at Scale" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Natural Language Processing with Spark NLP. Learning to Understand Text at Scale" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-920-4771-1, 9781492047711
- Data wydania ebooka:
- 2020-06-25 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 4.1MB
- Rozmiar pliku Mobi:
- 9.6MB
Spis treści ebooka
- Preface
- Why Natural Language Processing Is Important and Difficult
- Background
- Philosophy
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- I. Basics
- 1. Getting Started
- Introduction
- Other Tools
- Setting Up Your Environment
- Prerequisites
- Starting Apache Spark
- Checking Out the Code
- Getting Familiar with Apache Spark
- Starting Apache Spark with Spark NLP
- Loading and Viewing Data in Apache Spark
- Hello World with Spark NLP
- 2. Natural Language Basics
- What Is Natural Language?
- Origins of Language
- Spoken Language Versus Written Language
- What Is Natural Language?
- Linguistics
- Phonetics and Phonology
- Morphology
- Syntax
- Semantics
- Sociolinguistics: Dialects, Registers, and Other Varieties
- Formality
- Context
- Pragmatics
- Roman Jakobson
- How To Use Pragmatics
- Writing Systems
- Origins
- Alphabets
- Abjads
- Abugidas
- Syllabaries
- Logographs
- Encodings
- ASCII
- Unicode
- UTF-8
- Exercises: Tokenizing
- Tokenize English
- Tokenize Greek
- Tokenize Geez (Amharic)
- Resources
- 3. NLP on Apache Spark
- Parallelism, Concurrency, Distributing Computation
- Parallelization Before Apache Hadoop
- MapReduce and Apache Hadoop
- Apache Spark
- Parallelism, Concurrency, Distributing Computation
- Architecture of Apache Spark
- Physical Architecture
- Logical Architecture
- RDDs
- Partitioning
- Serialization
- Ordering
- Output and logging
- Spark jobs
- Persisting
- Python and R
- Spark SQL and Spark MLlib
- Transformers
- SQLTransformer
- Binarizer
- VectorAssembler
- Transformers
- Estimators and Models
- MinMaxScaler
- StringIndexer
- Evaluators
- Pipelines
- Cross validation
- Serialization of models
- NLP Libraries
- Functionality Libraries
- Annotation Libraries
- NLP in Other Libraries
- Spark NLP
- Annotation Library
- Stages
- Transformers
- DocumentAssembler
- Annotators
- SentenceDetector
- Tokenizer
- Lemmatizer
- POS tagger
- Pretrained Pipelines
- Explain document ML pipeline
- Finisher
- Exercises: Build a Topic Model
- Resources
- 4. Deep Learning Basics
- Gradient Descent
- Backpropagation
- Convolutional Neural Networks
- Filters
- Pooling
- Recurrent Neural Networks
- Backpropagation Through Time
- Elman Nets
- LSTMs
- Exercise 1
- Exercise 2
- Resources
- II. Building Blocks
- 5. Processing Words
- Tokenization
- Vocabulary Reduction
- Stemming
- Lemmatization
- Stemming Versus Lemmatization
- Spelling Correction
- Normalization
- Bag-of-Words
- CountVectorizer
- N-Gram
- Visualizing: Word and Document Distributions
- Exercises
- Resources
- 6. Information Retrieval
- Inverted Indices
- Building an Inverted Index
- Step 1
- Step 2
- Step 3
- Step 4
- Building an Inverted Index
- Inverted Indices
- Vector Space Model
- Stop-Word Removal
- Inverse Document Frequency
- In Spark
- Exercises
- Resources
- 7. Classification and Regression
- Bag-of-Words Features
- Regular Expression Features
- Feature Selection
- Modeling
- Nave Bayes
- Linear Models
- Decision/Regression Trees
- Deep Learning Algorithms
- Iteration
- Exercises
- 8. Sequence Modeling with Keras
- Sentence Segmentation
- (Hidden) Markov Models
- Sentence Segmentation
- Section Segmentation
- Part-of-Speech Tagging
- Conditional Random Field
- Chunking and Syntactic Parsing
- Language Models
- Recurrent Neural Networks
- Exercise: Character N-Grams
- Exercise: Word Language Model
- Resources
- 9. Information Extraction
- Named-Entity Recognition
- Coreference Resolution
- Assertion Status Detection
- Relationship Extraction
- Summary
- Exercises
- 10. Topic Modeling
- K-Means
- Latent Semantic Indexing
- Nonnegative Matrix Factorization
- Latent Dirichlet Allocation
- Exercises
- 11. Word Embeddings
- Word2vec
- GloVe
- fastText
- Transformers
- ELMo, BERT, and XLNet
- doc2vec
- Exercises
- III. Applications
- 12. Sentiment Analysis and Emotion Detection
- Problem Statement and Constraints
- Plan the Project
- Design the Solution
- Implement the Solution
- Test and Measure the Solution
- Business Metrics
- Model-Centric Metrics
- Infrastructure Metrics
- Process Metrics
- Offline Versus Online Model Measurement
- Review
- Initial Deployment
- Fallback Plans
- Next Steps
- Conclusion
- 13. Building Knowledge Bases
- Problem Statement and Constraints
- Plan the Project
- Design the Solution
- Implement the Solution
- Test and Measure the Solution
- Business Metrics
- Model-Centric Metrics
- Infrastructure Metrics
- Process Metrics
- Review
- Conclusion
- 14. Search Engine
- Problem Statement and Constraints
- Plan the Project
- Design the Solution
- Implement the Solution
- Test and Measure the Solution
- Business Metrics
- Model-Centric Metrics
- Review
- Conclusion
- 15. Chatbot
- Problem Statement and Constraints
- Plan the Project
- Design the Solution
- Implement the Solution
- Test and Measure the Solution
- Business Metrics
- Model-Centric Metrics
- Review
- Conclusion
- 16. Object Character Recognition
- Kinds of OCR Tasks
- Images of Printed Text and PDFs to Text
- Images of Handwritten Text to Text
- Images of Text in Environment to Text
- Images of Text to Target
- Note on Different Writing Systems
- Kinds of OCR Tasks
- Problem Statement and Constraints
- Plan the Project
- Implement the Solution
- Test and Measure the Solution
- Model-Centric Metrics
- Review
- Conclusion
- IV. Building NLP Systems
- 17. Supporting Multiple Languages
- Language Typology
- Scenario: Academic Paper Classification
- Text Processing in Different Languages
- Compound Words
- Morphological Complexity
- Transfer Learning and Multilingual Deep Learning
- Search Across Languages
- Checklist
- Conclusion
- 18. Human Labeling
- Guidelines
- Scenario: Academic Paper Classification
- Inter-Labeler Agreement
- Iterative Labeling
- Labeling Text
- Classification
- Tagging
- Checklist
- Conclusion
- 19. Productionizing NLP Applications
- Spark NLP Model Cache
- Spark NLP and TensorFlow Integration
- Spark Optimization Basics
- Design-Level Optimization
- Profiling Tools
- Monitoring
- Managing Data Resources
- Testing NLP-Based Applications
- Unit Tests
- Integration Tests
- Smoke and Sanity Tests
- Performance Tests
- Usability Tests
- Demoing NLP-Based Applications
- Checklists
- Model Deployment Checklist
- Scaling and Performance Checklist
- Testing Checklist
- Conclusion
- Glossary
- Index
O'Reilly Media - inne książki
-
Software as a service (SaaS) is on the path to becoming the de facto model for building, delivering, and operating software solutions. Adopting a multi-tenant SaaS model requires builders to take on a broad range of new architecture, implementation, and operational challenges. How data is partiti...(237.15 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
Great engineers don't necessarily make great leaders—at least, not without a lot of work. Finding your path to becoming a strong leader is often fraught with challenges. It's not easy to figure out how to be strategic, successful, and considerate while also being firm. Whether you're on the...(118.15 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%) -
Data science happens in code. The ability to write reproducible, robust, scaleable code is key to a data science project's success—and is absolutely essential for those working with production code. This practical book bridges the gap between data science and software engineering,and clearl...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
With the massive adoption of microservices, operators and developers face far more complexity in their applications today. Service meshes can help you manage this problem by providing a unified control plane to secure, manage, and monitor your entire network. This practical guide shows you how th...(194.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Get practical advice on how to leverage AI development tools for all stages of code creation, including requirements, planning, design, coding, debugging, testing, and documentation. With this book, beginners and experienced developers alike will learn how to use a wide range of tools, from gener...(164.25 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Rust's popularity is growing, due in part to features like memory safety, type safety, and thread safety. But these same elements can also make learning Rust a challenge, even for experienced programmers. This practical guide helps you make the transition to writing idiomatic Rust—while als...(164.25 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Advance your Power BI skills by adding AI to your repertoire at a practice level. With this practical book, business-oriented software engineers and developers will learn the terminologies, practices, and strategy necessary to successfully incorporate AI into your business intelligence estate. Je...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
Microservices can be a very effective approach for delivering value to your organization and to your customers. If you get them right, microservices help you to move fast by making changes to small parts of your system hundreds of times a day. But if you get them wrong, microservices will just ma...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(169.14 zł najniższa cena z 30 dni)
177.65 zł
209.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Natural Language Processing with Spark NLP. Learning to Understand Text at Scale Alex Thomas (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.