Generative AI on Kubernetes. Operationalizing Large Language Models Roland Huß, Daniele Zonca
- Autorzy:
- Roland Huß, Daniele Zonca
- Wydawnictwo:
- O'Reilly Media
- Ocena:
- Stron:
- 406
- Dostępne formaty:
-
ePubMobi
Opis
książki
:
Generative AI on Kubernetes. Operationalizing Large Language Models
Generative AI is revolutionizing industries, and Kubernetes has fast become the backbone for deploying and managing these resource-intensive workloads. This book serves as a practical, hands-on guide for MLOps engineers, software developers, Kubernetes administrators, and AI professionals ready to combine AI innovation with the power of cloud native infrastructure. Authors Roland Huß and Daniele Zonca provide a clear road map for training, fine-tuning, deploying, and scaling GenAI models on Kubernetes, addressing challenges like resource optimization, automation, and security along the way.
With actionable insights with real-world examples, readers will learn to tackle the opportunities and complexities of managing GenAI applications in production environments. Whether you're experimenting with large-scale language models or facing the nuances of AI deployment at scale, you'll uncover expertise you need to operationalize this exciting technology effectively.
- Learn how to deploy LLMs more efficiently with optimized inference runtimes
- Get hands-on with GPU scheduling, including hardware detection and multinode scaling
- Monitor and understand LLM-specific metrics like Time to First Token and token throughput
- Know when to fine-tune a model or when retrieval augmentation is the better choice
- Discover how to evaluate models with standardized benchmarks before committing GPU resources
- Learn to run agentic applications with secure tool integration, identity management, and persistent state
Wybrane bestsellery
O'Reilly Media - inne książki
Dzięki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep@ebookpoint.pl
Książka drukowana

Oceny i opinie klientów: Generative AI on Kubernetes. Operationalizing Large Language Models Roland Huß, Daniele Zonca
(0)