Natural Language Annotation for Machine Learning
- Autorzy:
- James Pustejovsky, Amber Stubbs
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 342
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Natural Language Annotation for Machine Learning
Create your own natural language training corpus for machine learning. Whether you’re working with English, Chinese, or any other natural language, this hands-on book guides you through a proven annotation development cycle—the process of adding metadata to your training corpus to help ML algorithms work more efficiently. You don’t need any programming or linguistics experience to get started.
Using detailed examples at every step, you’ll learn how the MATTER Annotation Development Process helps you Model, Annotate, Train, Test, Evaluate, and Revise your training corpus. You also get a complete walkthrough of a real-world annotation project.
- Define a clear annotation goal before collecting your dataset (corpus)
- Learn tools for analyzing the linguistic content of your corpus
- Build a model and specification for your annotation project
- Examine the different annotation formats, from basic XML to the Linguistic Annotation Framework
- Create a gold standard corpus that can be used to train and test ML algorithms
- Select the ML algorithms that will process your annotated data
- Evaluate the test results and revise your annotation task
- Learn how to use lightweight software for annotating texts and adjudicating the annotations
This book is a perfect companion to O’Reilly’s Natural Language Processing with Python.
Wybrane bestsellery
-
To czwarte, zaktualizowane wydanie znakomitego przewodnika poświęconego zastosowaniu uczenia maszynowego do rozwiązywania rzeczywistych problemów w analizie danych. Dzięki książce dowiesz się wszystkiego, co trzeba wiedzieć o wstępnym przetwarzaniu danych, znajdowaniu kluczowych spostrzeżeń, prog...
Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV
(83.40 zł najniższa cena z 30 dni)90.35 zł
139.00 zł(-35%) -
Dzięki tej książce łatwo przyswoisz teoretyczne podstawy i zaczniesz je płynnie wdrażać w rzeczywistych scenariuszach. Dowiesz się, w jaki sposób myślenie przyczynowe ułatwia rozwiązywanie problemów, i poznasz pojęcia Pearla, takie jak strukturalny model przyczynowy, interwencje, kontrfakty itp. ...
Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko
(65.40 zł najniższa cena z 30 dni)70.85 zł
109.00 zł(-35%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(53.40 zł najniższa cena z 30 dni)57.84 zł
89.00 zł(-35%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(107.40 zł najniższa cena z 30 dni)116.35 zł
179.00 zł(-35%) -
Książka stanowi kompendium wiedzy na temat tej niesłychanie szybko rozwijającej się i dynamicznie wkraczającej w nasze życie dziedziny. Została napisana tak, aby była przystępna dla osób posiadających podstawowe umiejętności matematyczne. Może stanowić podręcznik dla studentów takich kierunków ja...(29.40 zł najniższa cena z 30 dni)
31.85 zł
49.00 zł(-35%) -
To książka przeznaczona dla inżynierów, którzy chcą stosować systemy uczenia maszynowego do rozwiązywania rzeczywistych problemów biznesowych. Zaprezentowano w niej systemy ML używane w szybko rozwijających się startupach, a także przedstawiono holistyczne podejście do ich projektowania ― z...
Jak projektować systemy uczenia maszynowego. Iteracyjne tworzenie aplikacji gotowych do pracy Jak projektować systemy uczenia maszynowego. Iteracyjne tworzenie aplikacji gotowych do pracy
(53.40 zł najniższa cena z 30 dni)57.84 zł
89.00 zł(-35%) -
Oto pierwszy tom dzieła, które stanowi inspirujące spojrzenie na sztuczną inteligencję. Jego zrozumienie nie wymaga wybitnej znajomości informatyki i matematyki. Książka jest wspaniałą syntezą wczesnych i późniejszych koncepcji, a także technik, przeprowadzoną we frameworku idei, metod i technolo...
Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 1 Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 1
(101.40 zł najniższa cena z 30 dni)109.85 zł
169.00 zł(-35%)
Ebooka "Natural Language Annotation for Machine Learning" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Natural Language Annotation for Machine Learning" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Natural Language Annotation for Machine Learning" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-493-5976-8, 9781449359768
- Data wydania ebooka:
- 2012-10-11 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 3.9MB
- Rozmiar pliku Mobi:
- 3.9MB
Spis treści ebooka
- Natural Language Annotation for Machine Learning
- Preface
- Natural Language Annotation for Machine Learning
- Audience
- Organization of This Book
- Software Requirements
- Conventions Used in This Book
- Using Code Examples
- Safari Books Online
- How to Contact Us
- Acknowledgments
- James Adds:
- Amber Adds:
- 1. The Basics
- The Importance of Language Annotation
- The Layers of Linguistic Description
- What Is Natural Language Processing?
- The Importance of Language Annotation
- A Brief History of Corpus Linguistics
- What Is a Corpus?
- Early Use of Corpora
- Corpora Today
- Kinds of Annotation
- Language Data and Machine Learning
- Classification
- Clustering
- Structured Pattern Induction
- The Annotation Development Cycle
- Model the Phenomenon
- Annotate with the Specification
- Train and Test the Algorithms over the Corpus
- Evaluate the Results
- Revise the Model and Algorithms
- Summary
- 2. Defining Your Goal and Dataset
- Defining Your Goal
- The Statement of Purpose
- Refining Your Goal: Informativity Versus Correctness
- The scope of the annotation task
- What will the annotation be used for?
- What will the overall outcome be?
- Where will the corpus come from?
- How will the result be achieved?
- Defining Your Goal
- Background Research
- Language Resources
- Organizations and Conferences
- NLP Challenges
- Assembling Your Dataset
- The Ideal Corpus: Representative and Balanced
- Collecting Data from the Internet
- Eliciting Data from People
- Read speech
- Spontaneous speech
- The Size of Your Corpus
- Existing Corpora
- Distributions Within Corpora
- Summary
- 3. Corpus Analytics
- Basic Probability for Corpus Analytics
- Joint Probability Distributions
- Bayes Rule
- Basic Probability for Corpus Analytics
- Counting Occurrences
- Zipfs Law
- N-grams
- Language Models
- Summary
- 4. Building Your Model and Specification
- Some Example Models and Specs
- Film Genre Classification
- Adding Named Entities
- Semantic Roles
- Some Example Models and Specs
- Adopting (or Not Adopting) Existing Models
- Creating Your Own Model and Specification: Generality Versus Specificity
- Using Existing Models and Specifications
- Using Models Without Specifications
- Different Kinds of Standards
- ISO Standards
- Annotation format standards
- Annotation specification standards
- ISO Standards
- Community-Driven Standards
- Other Standards Affecting Annotation
- Summary
- 5. Applying and Adopting Annotation Standards
- Metadata Annotation: Document Classification
- Unique Labels: Movie Reviews
- Multiple Labels: Film Genres
- Metadata Annotation: Document Classification
- Text Extent Annotation: Named Entities
- Inline Annotation
- Stand-off Annotation by Tokens
- Stand-off Annotation by Character Location
- Linked Extent Annotation: Semantic Roles
- ISO Standards and You
- Summary
- 6. Annotation and Adjudication
- The Infrastructure of an Annotation Project
- Specification Versus Guidelines
- Be Prepared to Revise
- Preparing Your Data for Annotation
- Metadata
- Preprocessed Data
- Splitting Up the Files for Annotation
- Writing the Annotation Guidelines
- Example 1: Single LabelsMovie Reviews
- Example 2: Multiple LabelsFilm Genres
- Example 3: Extent AnnotationsNamed Entities
- Example 4: Link TagsSemantic Roles
- Annotators
- Choosing an Annotation Environment
- Evaluating the Annotations
- Cohens Kappa ()
- Fleisss Kappa ()
- Interpreting Kappa Coefficients
- Calculating in Other Contexts
- Creating the Gold Standard (Adjudication)
- Summary
- 7. Training: Machine Learning
- What Is Learning?
- Defining Our Learning Task
- Classifier Algorithms
- Decision Tree Learning
- Gender Identification
- Nave Bayes Learning
- Movie genre identification
- Sentiment classification
- Maximum Entropy Classifiers
- Other Classifiers to Know About
- Sequence Induction Algorithms
- Clustering and Unsupervised Learning
- Semi-Supervised Learning
- Matching Annotation to Algorithms
- Summary
- 8. Testing and Evaluation
- Testing Your Algorithm
- Evaluating Your Algorithm
- Confusion Matrices
- Calculating Evaluation Scores
- Percentage accuracy
- Precision and recall
- F-measure
- Other evaluation metrics
- Interpreting Evaluation Scores
- Problems That Can Affect Evaluation
- Dataset Is Too Small
- Algorithm Fits the Development Data Too Well
- Too Much Information in the Annotation
- Final Testing Scores
- Summary
- 9. Revising and Reporting
- Revising Your Project
- Corpus Distributions and Content
- Model and Specification
- Annotation
- Guidelines
- Annotators
- Tools
- Training and Testing
- Revising Your Project
- Reporting About Your Work
- About Your Corpus
- About Your Model and Specifications
- About Your Annotation Task and Annotators
- About Your ML Algorithm
- About Your Revisions
- Summary
- 10. Annotation: TimeML
- The Goal of TimeML
- Related Research
- Building the Corpus
- Model: Preliminary Specifications
- Times
- Signals
- Events
- Links
- Annotation: First Attempts
- Model: The TimeML Specification Used in TimeBank
- Time Expressions
- Events
- Signals
- Links
- Confidence
- Annotation: The Creation of TimeBank
- TimeML Becomes ISO-TimeML
- Modeling the Future: Directions for TimeML
- Narrative Containers
- Expanding TimeML to Other Domains
- Event Structures
- Summary
- 11. Automatic Annotation: Generating TimeML
- The TARSQI Components
- GUTime: Temporal Marker Identification
- EVITA: Event Recognition and Classification
- GUTenLINK
- Slinket
- SputLink
- Machine Learning in the TARSQI Components
- The TARSQI Components
- Improvements to the TTK
- Structural Changes
- Improvements to Temporal Entity Recognition: BTime
- Temporal Relation Identification
- Temporal Relation Validation
- Temporal Relation Visualization
- TimeML Challenges: TempEval-2
- TempEval-2: System Summaries
- Overview of Results
- Future of the TTK
- New Input Formats
- Narrative Containers/Narrative Times
- Medical Documents
- Cross-Document Analysis
- Summary
- 12. Afterword: The Future of Annotation
- Crowdsourcing Annotation
- Amazons Mechanical Turk
- Games with a Purpose (GWAP)
- User-Generated Content
- Crowdsourcing Annotation
- Handling Big Data
- Boosting
- Active Learning
- Semi-Supervised Learning
- NLP Online and in the Cloud
- Distributed Computing
- Shared Language Resources
- Shared Language Applications
- And Finally...
- A. List of Available Corpora and Specifications
- Corpora
- Specifications, Guidelines, and Other Resources
- Representation Standards
- B. List of Software Resources
- Annotation and Adjudication Software
- Multipurpose Tools
- Corpus Creation and Exploration Tools
- Manual Annotation Tools
- Automated Annotation Tools
- Multipurpose tools
- Phonetic annotation
- Part-of-speech taggers/syntactic parsers
- Tokenizers/chunkers/stemmers
- Other
- Annotation and Adjudication Software
- Machine Learning Resources
- C. MAE User Guide
- Installing and Running MAE
- Loading Tasks and Files
- Loading a Task
- Loading a File
- Annotating Entities
- Attribute information
- Nonconsuming tags
- Annotating Links
- Deleting Tags
- Saving Files
- Defining Your Own Task
- Task Name
- Elements (a.k.a. Tags)
- Attributes
- id attributes
- start attribute
- Attribute types
- Default attribute values
- Frequently Asked Questions
- D. MAI User Guide
- Installing and Running MAI
- Loading Tasks and Files
- Loading a Task
- Loading Files
- Adjudicating
- The MAI Window
- Adjudicating a Tag
- Extent Tags
- Link Tags
- Nonconsuming Tags
- Adding New Tags
- Deleting tags
- Saving Files
- E. Bibliography
- References for Using Amazons Mechanical Turk/Crowdsourcing
- Index
- About the Authors
- Colophon
- Copyright
O'Reilly Media - inne książki
-
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(203.15 zł najniższa cena z 30 dni)
203.29 zł
239.00 zł(-15%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(237.15 zł najniższa cena z 30 dni)
244.53 zł
279.00 zł(-12%) -
Frontend developers have to consider many things: browser compatibility, usability, performance, scalability, SEO, and other best practices. But the most fundamental aspect of creating websites is one that often falls short: accessibility. Accessibility is the cornerstone of any website, and if a...(202.60 zł najniższa cena z 30 dni)
202.55 zł
239.00 zł(-15%) -
In this insightful and comprehensive guide, Addy Osmani shares more than a decade of experience working on the Chrome team at Google, uncovering secrets to engineering effectiveness, efficiency, and team success. Engineers and engineering leaders looking to scale their effectiveness and drive tra...(116.53 zł najniższa cena z 30 dni)
116.48 zł
149.00 zł(-22%) -
Data modeling is the single most overlooked feature in Power BI Desktop, yet it's what sets Power BI apart from other tools on the market. This practical book serves as your fast-forward button for data modeling with Power BI, Analysis Services tabular, and SQL databases. It serves as a starting ...(202.78 zł najniższa cena z 30 dni)
202.28 zł
239.00 zł(-15%) -
C# is undeniably one of the most versatile programming languages available to engineers today. With this comprehensive guide, you'll learn just how powerful the combination of C# and .NET can be. Author Ian Griffiths guides you through C# 12.0 and .NET 8 fundamentals and techniques for building c...(245.09 zł najniższa cena z 30 dni)
244.59 zł
279.00 zł(-12%) -
Learn how to get started with Futures Thinking. With this practical guide, Phil Balagtas, founder of the Design Futures Initiative and the global Speculative Futures network, shows you how designers and futurists have made futures work at companies such as Atari, IBM, Apple, Disney, Autodesk, Luf...(150.10 zł najniższa cena z 30 dni)
150.00 zł
179.00 zł(-16%) -
Augmented Analytics isn't just another book on data and analytics; it's a holistic resource for reimagining the way your entire organization interacts with information to become insight-driven.Moving beyond traditional, limited ways of making sense of data, Augmented Analytics provides a dynamic,...(178.05 zł najniższa cena z 30 dni)
177.85 zł
209.00 zł(-15%) -
Learn how to prepare for—and pass—the Kubernetes and Cloud Native Associate (KCNA) certification exam. This practical guide serves as both a study guide and point of entry for practitioners looking to explore and adopt cloud native technologies. Adrián González Sánchez ...
Kubernetes and Cloud Native Associate (KCNA) Study Guide Kubernetes and Cloud Native Associate (KCNA) Study Guide
(169.14 zł najniższa cena z 30 dni)177.65 zł
199.00 zł(-11%) -
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(143.54 zł najniższa cena z 30 dni)
143.04 zł
179.00 zł(-20%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Natural Language Annotation for Machine Learning James Pustejovsky, Amber Stubbs (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.