Natural Language Processing with Transformers, Revised Edition
- Autorzy:
- Lewis Tunstall, Leandro von Werra, Thomas Wolf
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 408
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Natural Language Processing with Transformers, Revised Edition
Since their introduction in 2017, transformers have quickly become the dominant architecture for achieving state-of-the-art results on a variety of natural language processing tasks. If you're a data scientist or coder, this practical book -now revised in full color- shows you how to train and scale these large models using Hugging Face Transformers, a Python-based deep learning library.
Transformers have been used to write realistic news stories, improve Google Search queries, and even create chatbots that tell corny jokes. In this guide, authors Lewis Tunstall, Leandro von Werra, and Thomas Wolf, among the creators of Hugging Face Transformers, use a hands-on approach to teach you how transformers work and how to integrate them in your applications. You'll quickly learn a variety of tasks they can help you solve.
- Build, debug, and optimize transformer models for core NLP tasks, such as text classification, named entity recognition, and question answering
- Learn how transformers can be used for cross-lingual transfer learning
- Apply transformers in real-world scenarios where labeled data is scarce
- Make transformer models efficient for deployment using techniques such as distillation, pruning, and quantization
- Train transformers from scratch and learn how to scale to multiple GPUs and distributed environments
Wybrane bestsellery
-
Tę książkę docenią praktycy: inżynierowie uczenia maszynowego i analitycy danych, poszukujący sposobu praktycznego zaadaptowania modeli transformacyjnych do swoich potrzeb. Autorzy skupili się na praktycznej stronie tworzenia aplikacji językowych, a w poszczególnych rozdziałach ujęto wszystkie na...
Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face
(59.40 zł najniższa cena z 30 dni)59.40 zł
99.00 zł(-40%) -
To czwarte, zaktualizowane wydanie znakomitego przewodnika poświęconego zastosowaniu uczenia maszynowego do rozwiązywania rzeczywistych problemów w analizie danych. Dzięki książce dowiesz się wszystkiego, co trzeba wiedzieć o wstępnym przetwarzaniu danych, znajdowaniu kluczowych spostrzeżeń, prog...
Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV
(83.40 zł najniższa cena z 30 dni)83.40 zł
139.00 zł(-40%) -
Dzięki tej książce łatwo przyswoisz teoretyczne podstawy i zaczniesz je płynnie wdrażać w rzeczywistych scenariuszach. Dowiesz się, w jaki sposób myślenie przyczynowe ułatwia rozwiązywanie problemów, i poznasz pojęcia Pearla, takie jak strukturalny model przyczynowy, interwencje, kontrfakty itp. ...
Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko
(65.40 zł najniższa cena z 30 dni)65.40 zł
109.00 zł(-40%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(53.40 zł najniższa cena z 30 dni)53.40 zł
89.00 zł(-40%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(41.40 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(107.40 zł najniższa cena z 30 dni)107.40 zł
179.00 zł(-40%) -
Książka stanowi kompendium wiedzy na temat tej niesłychanie szybko rozwijającej się i dynamicznie wkraczającej w nasze życie dziedziny. Została napisana tak, aby była przystępna dla osób posiadających podstawowe umiejętności matematyczne. Może stanowić podręcznik dla studentów takich kierunków ja...(29.40 zł najniższa cena z 30 dni)
29.40 zł
49.00 zł(-40%) -
To książka przeznaczona dla inżynierów, którzy chcą stosować systemy uczenia maszynowego do rozwiązywania rzeczywistych problemów biznesowych. Zaprezentowano w niej systemy ML używane w szybko rozwijających się startupach, a także przedstawiono holistyczne podejście do ich projektowania ― z...
Jak projektować systemy uczenia maszynowego. Iteracyjne tworzenie aplikacji gotowych do pracy Jak projektować systemy uczenia maszynowego. Iteracyjne tworzenie aplikacji gotowych do pracy
(53.40 zł najniższa cena z 30 dni)53.40 zł
89.00 zł(-40%) -
Oto pierwszy tom dzieła, które stanowi inspirujące spojrzenie na sztuczną inteligencję. Jego zrozumienie nie wymaga wybitnej znajomości informatyki i matematyki. Książka jest wspaniałą syntezą wczesnych i późniejszych koncepcji, a także technik, przeprowadzoną we frameworku idei, metod i technolo...
Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 1 Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 1
(101.40 zł najniższa cena z 30 dni)101.40 zł
169.00 zł(-40%) -
To praktyczny przewodnik po algorytmach sztucznej inteligencji. Skorzystają z niego programiści i inżynierowie, którzy chcą zrozumieć zagadnienia i algorytmy związane ze sztuczną inteligencją na podstawie praktycznych przykładów i wizualnych wyjaśnień. Książka pokazuje, jak radzić sobie z takimi ...
Algorytmy sztucznej inteligencji. Ilustrowany przewodnik Algorytmy sztucznej inteligencji. Ilustrowany przewodnik
(47.40 zł najniższa cena z 30 dni)47.40 zł
79.00 zł(-40%)
O autorach ebooka
Lewis Tunstall obecnie tworzy narzędzia dla społeczności NLP.
Leandro von Werra zajmuje się głównie modelami generowania kodu i komunikacją ze społecznością.
Thomas Wolf jest głównym dyrektorem naukowym. Zajmuje się możliwie najszerszym upowszechnianiem wyników badań nad sztuczną inteligencją.
Kup polskie wydanie:
Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face
- Autor:
- Lewis Tunstall, Leandro von Werra, Thomas Wolf
49,50 zł
99,00 zł
(49.50 zł najniższa cena z 30 dni)
Ebooka "Natural Language Processing with Transformers, Revised Edition" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Natural Language Processing with Transformers, Revised Edition" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Natural Language Processing with Transformers, Revised Edition" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-3675-8, 9781098136758
- Data wydania ebooka:
- 2022-05-26 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 10.8MB
- Rozmiar pliku Mobi:
- 19.2MB
Spis treści ebooka
- Foreword
- Preface
- Who Is This Book For?
- What You Will Learn
- Software and Hardware Requirements
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- Lewis
- Leandro
- Thomas
- 1. Hello Transformers
- The Encoder-Decoder Framework
- Attention Mechanisms
- Transfer Learning in NLP
- Hugging Face Transformers: Bridging the Gap
- A Tour of Transformer Applications
- Text Classification
- Named Entity Recognition
- Question Answering
- Summarization
- Translation
- Text Generation
- The Hugging Face Ecosystem
- The Hugging Face Hub
- Hugging Face Tokenizers
- Hugging Face Datasets
- Hugging Face Accelerate
- Main Challenges with Transformers
- Conclusion
- 2. Text Classification
- The Dataset
- A First Look at Hugging Face Datasets
- From Datasets to DataFrames
- Looking at the Class Distribution
- How Long Are Our Tweets?
- The Dataset
- From Text to Tokens
- Character Tokenization
- Word Tokenization
- Subword Tokenization
- Tokenizing the Whole Dataset
- Training a Text Classifier
- Transformers as Feature Extractors
- Using pretrained models
- Extracting the last hidden states
- Creating a feature matrix
- Visualizing the training set
- Training a simple classifier
- Transformers as Feature Extractors
- Fine-Tuning Transformers
- Loading a pretrained model
- Defining the performance metrics
- Training the model
- Error analysis
- Saving and sharing the model
- Conclusion
- 3. Transformer Anatomy
- The Transformer Architecture
- The Encoder
- Self-Attention
- Scaled dot-product attention
- Multi-headed attention
- Self-Attention
- The Feed-Forward Layer
- Adding Layer Normalization
- Positional Embeddings
- Adding a Classification Head
- The Decoder
- Meet the Transformers
- The Transformer Tree of Life
- The Encoder Branch
- The Decoder Branch
- The Encoder-Decoder Branch
- Conclusion
- 4. Multilingual Named Entity Recognition
- The Dataset
- Multilingual Transformers
- A Closer Look at Tokenization
- The Tokenizer Pipeline
- The SentencePiece Tokenizer
- Transformers for Named Entity Recognition
- The Anatomy of the Transformers Model Class
- Bodies and Heads
- Creating a Custom Model for Token Classification
- Loading a Custom Model
- Tokenizing Texts for NER
- Performance Measures
- Fine-Tuning XLM-RoBERTa
- Error Analysis
- Cross-Lingual Transfer
- When Does Zero-Shot Transfer Make Sense?
- Fine-Tuning on Multiple Languages at Once
- Interacting with Model Widgets
- Conclusion
- 5. Text Generation
- The Challenge with Generating Coherent Text
- Greedy Search Decoding
- Beam Search Decoding
- Sampling Methods
- Top-k and Nucleus Sampling
- Which Decoding Method Is Best?
- Conclusion
- 6. Summarization
- The CNN/DailyMail Dataset
- Text Summarization Pipelines
- Summarization Baseline
- GPT-2
- T5
- BART
- PEGASUS
- Comparing Different Summaries
- Measuring the Quality of Generated Text
- BLEU
- ROUGE
- Evaluating PEGASUS on the CNN/DailyMail Dataset
- Training a Summarization Model
- Evaluating PEGASUS on SAMSum
- Fine-Tuning PEGASUS
- Generating Dialogue Summaries
- Conclusion
- 7. Question Answering
- Building a Review-Based QA System
- The Dataset
- Extracting Answers from Text
- Span classification
- Tokenizing text for QA
- Dealing with long passages
- Using Haystack to Build a QA Pipeline
- Initializing a document store
- Initializing a retriever
- Initializing a reader
- Putting it all together
- Building a Review-Based QA System
- Improving Our QA Pipeline
- Evaluating the Retriever
- Dense Passage Retrieval
- Evaluating the Retriever
- Evaluating the Reader
- Domain Adaptation
- Evaluating the Whole QA Pipeline
- Going Beyond Extractive QA
- Conclusion
- 8. Making Transformers Efficient in Production
- Intent Detection as a Case Study
- Creating a Performance Benchmark
- Making Models Smaller via Knowledge Distillation
- Knowledge Distillation for Fine-Tuning
- Knowledge Distillation for Pretraining
- Creating a Knowledge Distillation Trainer
- Choosing a Good Student Initialization
- Finding Good Hyperparameters with Optuna
- Benchmarking Our Distilled Model
- Making Models Faster with Quantization
- Benchmarking Our Quantized Model
- Optimizing Inference with ONNX and the ONNX Runtime
- Making Models Sparser with Weight Pruning
- Sparsity in Deep Neural Networks
- Weight Pruning Methods
- Magnitude pruning
- Movement pruning
- Conclusion
- 9. Dealing with Few to No Labels
- Building a GitHub Issues Tagger
- Getting the Data
- Preparing the Data
- Creating Training Sets
- Creating Training Slices
- Building a GitHub Issues Tagger
- Implementing a Naive Bayesline
- Working with No Labeled Data
- Working with a Few Labels
- Data Augmentation
- Using Embeddings as a Lookup Table
- Fine-Tuning a Vanilla Transformer
- In-Context and Few-Shot Learning with Prompts
- Leveraging Unlabeled Data
- Fine-Tuning a Language Model
- Fine-Tuning a Classifier
- Advanced Methods
- Unsupervised data augmentation
- Uncertainty-aware self-training
- Conclusion
- 10. Training Transformers from Scratch
- Large Datasets and Where to Find Them
- Challenges of Building a Large-Scale Corpus
- Building a Custom Code Dataset
- Creating a dataset with Google BigQuery
- Working with Large Datasets
- Memory mapping
- Streaming
- Large Datasets and Where to Find Them
- Adding Datasets to the Hugging Face Hub
- Building a Tokenizer
- The Tokenizer Model
- Measuring Tokenizer Performance
- A Tokenizer for Python
- Training a Tokenizer
- Saving a Custom Tokenizer on the Hub
- Training a Model from Scratch
- A Tale of Pretraining Objectives
- Causal language modeling
- Masked language modeling
- Sequence-to-sequence training
- A Tale of Pretraining Objectives
- Initializing the Model
- Implementing the Dataloader
- Defining the Training Loop
- The Training Run
- Results and Analysis
- Conclusion
- 11. Future Directions
- Scaling Transformers
- Scaling Laws
- Challenges with Scaling
- Attention Please!
- Sparse Attention
- Linearized Attention
- Scaling Transformers
- Going Beyond Text
- Vision
- iGPT
- ViT
- Vision
- Tables
- Multimodal Transformers
- Speech-to-Text
- Vision and Text
- VQA
- LayoutLM
- DALLE
- CLIP
- Where to from Here?
- Index
O'Reilly Media - inne książki
-
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(200.58 zł najniższa cena z 30 dni)
200.38 zł
239.00 zł(-16%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(241.06 zł najniższa cena z 30 dni)
241.01 zł
289.00 zł(-17%) -
Frontend developers have to consider many things: browser compatibility, usability, performance, scalability, SEO, and other best practices. But the most fundamental aspect of creating websites is one that often falls short: accessibility. Accessibility is the cornerstone of any website, and if a...(199.29 zł najniższa cena z 30 dni)
198.79 zł
239.00 zł(-17%) -
In this insightful and comprehensive guide, Addy Osmani shares more than a decade of experience working on the Chrome team at Google, uncovering secrets to engineering effectiveness, efficiency, and team success. Engineers and engineering leaders looking to scale their effectiveness and drive tra...(114.23 zł najniższa cena z 30 dni)
113.73 zł
149.00 zł(-24%) -
Data modeling is the single most overlooked feature in Power BI Desktop, yet it's what sets Power BI apart from other tools on the market. This practical book serves as your fast-forward button for data modeling with Power BI, Analysis Services tabular, and SQL databases. It serves as a starting ...(198.48 zł najniższa cena z 30 dni)
198.43 zł
239.00 zł(-17%) -
C# is undeniably one of the most versatile programming languages available to engineers today. With this comprehensive guide, you'll learn just how powerful the combination of C# and .NET can be. Author Ian Griffiths guides you through C# 12.0 and .NET 8 fundamentals and techniques for building c...(240.17 zł najniższa cena z 30 dni)
240.07 zł
289.00 zł(-17%) -
Learn how to get started with Futures Thinking. With this practical guide, Phil Balagtas, founder of the Design Futures Initiative and the global Speculative Futures network, shows you how designers and futurists have made futures work at companies such as Atari, IBM, Apple, Disney, Autodesk, Luf...(147.60 zł najniższa cena z 30 dni)
147.09 zł
179.00 zł(-18%) -
Augmented Analytics isn't just another book on data and analytics; it's a holistic resource for reimagining the way your entire organization interacts with information to become insight-driven.Moving beyond traditional, limited ways of making sense of data, Augmented Analytics provides a dynamic,...(173.34 zł najniższa cena z 30 dni)
173.13 zł
219.00 zł(-21%) -
Learn how to prepare for—and pass—the Kubernetes and Cloud Native Associate (KCNA) certification exam. This practical guide serves as both a study guide and point of entry for practitioners looking to explore and adopt cloud native technologies. Adrián González Sánchez ...
Kubernetes and Cloud Native Associate (KCNA) Study Guide Kubernetes and Cloud Native Associate (KCNA) Study Guide
(169.14 zł najniższa cena z 30 dni)177.65 zł
199.00 zł(-11%) -
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(139.84 zł najniższa cena z 30 dni)
139.74 zł
179.00 zł(-22%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Natural Language Processing with Transformers, Revised Edition Lewis Tunstall, Leandro von Werra, Thomas Wolf (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.