The Enterprise Big Data Lake. Delivering the Promise of Big Data and Data Science
![Język publikacji: angielski Język publikacji: angielski](https://static01.helion.com.pl/global/flagi/1.png)
- Autor:
- Alex Gorelik
![The Enterprise Big Data Lake. Delivering the Promise of Big Data and Data Science Alex Gorelik - okładka ebooka](https://static01.helion.com.pl/global/okladki/326x466/e_11ic.png)
![The Enterprise Big Data Lake. Delivering the Promise of Big Data and Data Science Alex Gorelik - tył okładki ebooka](https://static01.helion.com.pl/global/okladki-tyl/326x466/e_11ic.png)
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 224
- Dostępne formaty:
-
ePubMobi
Opis ebooka: The Enterprise Big Data Lake. Delivering the Promise of Big Data and Data Science
The data lake is a daring new approach for harnessing the power of big data technology and providing convenient self-service capabilities. But is it right for your company? This book is based on discussions with practitioners and executives from more than a hundred organizations, ranging from data-driven companies such as Google, LinkedIn, and Facebook, to governments and traditional corporate enterprises. You’ll learn what a data lake is, why enterprises need one, and how to build one successfully with the best practices in this book.
Alex Gorelik, CTO and founder of Waterline Data, explains why old systems and processes can no longer support data needs in the enterprise. Then, in a collection of essays about data lake implementation, you’ll examine data lake initiatives, analytic projects, experiences, and best practices from data experts working in various industries.
- Get a succinct introduction to data warehousing, big data, and data science
- Learn various paths enterprises take to build a data lake
- Explore how to build a self-service model and best practices for providing analysts access to the data
- Use different methods for architecting your data lake
- Discover ways to implement a data lake from experts in different industries
Wybrane bestsellery
-
Ta książka jest praktycznym przewodnikiem, który ułatwia wdrażanie architektury jeziora danych (ang. data lake) w przedsiębiorstwie. Omówiono tu różne podejścia do jej uruchamiania i rozwijania, w tym kałuże danych (analityczne piaskownice) i stawy danych (hurtownie danych), a także budowanie jez...
Korporacyjne jezioro danych. Wykorzystaj potencjał big data w swojej organizacji Korporacyjne jezioro danych. Wykorzystaj potencjał big data w swojej organizacji
(24.50 zł najniższa cena z 30 dni)24.50 zł
49.00 zł(-50%) -
To czwarte, zaktualizowane wydanie znakomitego przewodnika poświęconego zastosowaniu uczenia maszynowego do rozwiązywania rzeczywistych problemów w analizie danych. Dzięki książce dowiesz się wszystkiego, co trzeba wiedzieć o wstępnym przetwarzaniu danych, znajdowaniu kluczowych spostrzeżeń, prog...
Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV
(83.40 zł najniższa cena z 30 dni)83.40 zł
139.00 zł(-40%) -
Dzięki tej książce łatwo przyswoisz teoretyczne podstawy i zaczniesz je płynnie wdrażać w rzeczywistych scenariuszach. Dowiesz się, w jaki sposób myślenie przyczynowe ułatwia rozwiązywanie problemów, i poznasz pojęcia Pearla, takie jak strukturalny model przyczynowy, interwencje, kontrfakty itp. ...
Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko
(65.40 zł najniższa cena z 30 dni)65.40 zł
109.00 zł(-40%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(53.40 zł najniższa cena z 30 dni)53.40 zł
89.00 zł(-40%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(41.40 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(107.40 zł najniższa cena z 30 dni)107.40 zł
179.00 zł(-40%) -
Książka stanowi kompendium wiedzy na temat tej niesłychanie szybko rozwijającej się i dynamicznie wkraczającej w nasze życie dziedziny. Została napisana tak, aby była przystępna dla osób posiadających podstawowe umiejętności matematyczne. Może stanowić podręcznik dla studentów takich kierunków ja...(29.40 zł najniższa cena z 30 dni)
29.40 zł
49.00 zł(-40%) -
To książka przeznaczona dla inżynierów, którzy chcą stosować systemy uczenia maszynowego do rozwiązywania rzeczywistych problemów biznesowych. Zaprezentowano w niej systemy ML używane w szybko rozwijających się startupach, a także przedstawiono holistyczne podejście do ich projektowania ― z...
Jak projektować systemy uczenia maszynowego. Iteracyjne tworzenie aplikacji gotowych do pracy Jak projektować systemy uczenia maszynowego. Iteracyjne tworzenie aplikacji gotowych do pracy
(53.40 zł najniższa cena z 30 dni)53.40 zł
89.00 zł(-40%) -
Oto pierwszy tom dzieła, które stanowi inspirujące spojrzenie na sztuczną inteligencję. Jego zrozumienie nie wymaga wybitnej znajomości informatyki i matematyki. Książka jest wspaniałą syntezą wczesnych i późniejszych koncepcji, a także technik, przeprowadzoną we frameworku idei, metod i technolo...
Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 1 Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 1
(101.40 zł najniższa cena z 30 dni)101.40 zł
169.00 zł(-40%)
O autorze ebooka
Alex Gorelik jest CEO i założycielem firmy Waterline Data. Wcześniej zakładał startupy, zajmował się marketingiem oraz badaniami produktów, zarządzał zespołem kilkuset inżynierów i pracował nad integracją danych w firmie IBM. Jego kariera jest nieodłącznie związana z nowoczesnymi technologiami przetwarzania danych i ich wdrażaniem dla potrzeb biznesu.
Kup polskie wydanie:
Korporacyjne jezioro danych. Wykorzystaj potencjał big data w swojej organizacji
- Autor:
- Alex Gorelik
24,50 zł
49,00 zł
(24.50 zł najniższa cena z 30 dni)
Ebooka "The Enterprise Big Data Lake. Delivering the Promise of Big Data and Data Science" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "The Enterprise Big Data Lake. Delivering the Promise of Big Data and Data Science" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "The Enterprise Big Data Lake. Delivering the Promise of Big Data and Data Science" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-919-3150-9, 9781491931509
- Data wydania ebooka:
-
2019-02-21
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 8.7MB
- Rozmiar pliku Mobi:
- 17.8MB
Spis treści ebooka
- Preface
- Who Should Read This Book?
- Conventions Used in This Book
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- 1. Introduction to Data Lakes
- Data Lake Maturity
- Data Puddles
- Data Ponds
- Data Lake Maturity
- Creating a Successful Data Lake
- The Right Platform
- The Right Data
- The Right Interface
- Providing data at the right level of expertise
- Getting to the data
- The Data Swamp
- Roadmap to Data Lake Success
- Standing Up a Data Lake
- Organizing the Data Lake
- Setting Up the Data Lake for Self-Service
- Finding and understanding the data
- Accessing and provisioning the data
- Preparing the data
- Analysis and visualization
- Data Lake Architectures
- Data Lakes in the Public Cloud
- Logical Data Lakes
- Virtualization versus a catalog-based logical data lake
- Conclusion
- 2. Historical Perspective
- The Drive for Self-Service DataThe Birth of Databases
- The Analytics ImperativeThe Birth of Data Warehousing
- The Data Warehouse Ecosystem
- Storing and Querying the Data
- Dimensional modeling and star schemas
- Slowly changing dimensions
- Massively parallel processing (MPP) systems
- Data warehouse (DW) appliances
- Columnar stores
- In-memory databases
- Storing and Querying the Data
- Loading the DataData Integration Tools
- ETL
- ETL versus ELT
- Federation, EII, and data virtualization tools
- Organizing and Managing the Data
- Data quality tools
- MDM systems
- Data modeling tools
- Metadata repositories
- Data governance tools
- Consuming the Data
- Advanced analytics
- Conclusion
- 3. Introduction to Big Data and Data Science
- Hadoop Leads the Historic Shift to Big Data
- The Hadoop File System
- How Processing and Storage Interact in a MapReduce Job
- Schema on Read
- Hadoop Projects
- Hadoop Leads the Historic Shift to Big Data
- Data Science
- What Should Your Analytics Organization Focus On?
- Machine Learning
- Explainability
- Change Management
- Conclusion
- 4. Starting a Data Lake
- The What and Why of Hadoop
- Preventing Proliferation of Data Puddles
- Taking Advantage of Big Data
- Leading with Data Science
- Strategy 1: Offload Existing Functionality
- Strategy 2: Data Lakes for New Projects
- Strategy 3: Establish a Central Point of Governance
- Which Way Is Right for You?
- Conclusion
- 5. From Data Ponds/Big Data Warehouses to Data Lakes
- Essential Functions of a Data Warehouse
- Dimensional Modeling for Analytics
- Integrating Data from Disparate Sources
- Preserving History Using Slowly Changing Dimensions
- Limitations of the Data Warehouse as a Historical Repository
- Essential Functions of a Data Warehouse
- Moving to a Data Pond
- Keeping History in a Data Pond
- Implementing Slowly Changing Dimensions in a Data Pond
- Denormalizing attributes to preserve state
- Preserving state using snapshots
- Growing Data Ponds into a Data LakeLoading Data Thats Not in the Data Warehouse
- Raw Data
- External Data
- Internet of Things (IoT) and Other Streaming Data
- Real-Time Data Lakes
- The Lambda Architecture
- Data Transformations
- Target Systems
- Data Warehouses
- Operational Data Stores
- Real-Time Applications and Data Products
- Conclusion
- 6. Optimizing for Self-Service
- The Beginnings of Self-Service
- Business Analysts
- Finding and Understanding DataDocumenting the Enterprise
- Establishing Trust
- Data quality
- Lineage (provenance)
- Stewardship
- Provisioning
- Preparing Data for Analysis
- Data Wrangling in the Data Lake
- Situating Data Preparation in Hadoop
- Common Use Cases for Data Preparation
- Use case: Self-service automation for analytics or business applications
- Customer example
- Use case: Preparation for IT operationalization
- Customer example
- Use case: Exploratory analytics and machine learning
- Customer example
- Analyzing and Visualizing
- The New World of Self-Service Business Intelligence
- The New Analytic Workflow
- Gatekeepers to Shopkeepers
- Governing Self-Service
- Conclusion
- 7. Architecting the Data Lake
- Organizing the Data Lake
- Landing or Raw Zone
- Gold Zone
- Work Zone
- Sensitive Zone
- Deidentification
- Organizing the Data Lake
- Multiple Data Lakes
- Advantages of Keeping Data Lakes Separate
- Advantages of Merging the Data Lakes
- Cloud Data Lakes
- Virtual Data Lakes
- Data Federation
- Big Data Virtualization
- Eliminating Redundancy
- Conclusion
- 8. Cataloging the Data Lake
- Organizing the Data
- Technical Metadata
- Data profiling
- Profiling hierarchical data
- Technical Metadata
- Business Metadata
- Glossaries, taxonomies, and ontologies
- Industry ontologies
- Folksonomies
- Organizing the Data
- Tagging
- Automated Cataloging
- Logical Data Management
- Sensitive Data Management and Access Control
- Automated and manual vetting
- Sensitive Data Management and Access Control
- Data Quality
- Tag-based data quality rules
- Annotation quality
- Curation quality
- Data set quality
- Relating Disparate Data
- Establishing Lineage
- Data Provisioning
- Tools for Building a Catalog
- Tool Comparison
- The Data Ocean
- Conclusion
- 9. Governing Data Access
- Authorization or Access Control
- Tag-Based Data Access Policies
- Deidentifying Sensitive Data
- Data Sovereignty and Regulatory Compliance
- Self-Service Access Management
- Provisioning Data
- Conclusion
- 10. Industry-Specific Perspectives
- Big Data in Financial Services
- Consumers, Digitization, and Data Are Changing Finance as We Know It
- Saving the Bank
- New Opportunities Offered by New Data
- Key Processes in Making Use of the Data Lake
- Data inventory and cataloging
- Entity resolution and fuzzy matching
- Analytics and modeling
- Big Data in Financial Services
- Value Added by Data Lakes in Financial Services
- Data Lakes in the Insurance Industry
- Smart Cities
- Big Data in Medicine
- Index
O'Reilly Media - inne książki
-
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(201.03 zł najniższa cena z 30 dni)
200.93 zł
239.00 zł(-16%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(241.36 zł najniższa cena z 30 dni)
241.26 zł
289.00 zł(-17%) -
Frontend developers have to consider many things: browser compatibility, usability, performance, scalability, SEO, and other best practices. But the most fundamental aspect of creating websites is one that often falls short: accessibility. Accessibility is the cornerstone of any website, and if a...(200.59 zł najniższa cena z 30 dni)
200.09 zł
239.00 zł(-16%) -
In this insightful and comprehensive guide, Addy Osmani shares more than a decade of experience working on the Chrome team at Google, uncovering secrets to engineering effectiveness, efficiency, and team success. Engineers and engineering leaders looking to scale their effectiveness and drive tra...(114.93 zł najniższa cena z 30 dni)
114.88 zł
149.00 zł(-23%) -
Data modeling is the single most overlooked feature in Power BI Desktop, yet it's what sets Power BI apart from other tools on the market. This practical book serves as your fast-forward button for data modeling with Power BI, Analysis Services tabular, and SQL databases. It serves as a starting ...(199.08 zł najniższa cena z 30 dni)
198.88 zł
239.00 zł(-17%) -
C# is undeniably one of the most versatile programming languages available to engineers today. With this comprehensive guide, you'll learn just how powerful the combination of C# and .NET can be. Author Ian Griffiths guides you through C# 12.0 and .NET 8 fundamentals and techniques for building c...(241.02 zł najniższa cena z 30 dni)
240.92 zł
289.00 zł(-17%) -
Learn how to get started with Futures Thinking. With this practical guide, Phil Balagtas, founder of the Design Futures Initiative and the global Speculative Futures network, shows you how designers and futurists have made futures work at companies such as Atari, IBM, Apple, Disney, Autodesk, Luf...(148.10 zł najniższa cena z 30 dni)
148.00 zł
179.00 zł(-17%) -
Augmented Analytics isn't just another book on data and analytics; it's a holistic resource for reimagining the way your entire organization interacts with information to become insight-driven.Moving beyond traditional, limited ways of making sense of data, Augmented Analytics provides a dynamic,...(174.74 zł najniższa cena z 30 dni)
174.54 zł
219.00 zł(-20%) -
Learn how to prepare for—and pass—the Kubernetes and Cloud Native Associate (KCNA) certification exam. This practical guide serves as both a study guide and point of entry for practitioners looking to explore and adopt cloud native technologies. Adrián González Sánchez ...
Kubernetes and Cloud Native Associate (KCNA) Study Guide Kubernetes and Cloud Native Associate (KCNA) Study Guide
(169.14 zł najniższa cena z 30 dni)177.65 zł
199.00 zł(-11%) -
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(140.34 zł najniższa cena z 30 dni)
140.14 zł
179.00 zł(-22%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
![Loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
![ajax-loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
Oceny i opinie klientów: The Enterprise Big Data Lake. Delivering the Promise of Big Data and Data Science Alex Gorelik (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.