Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie
- Ocena:
- 3.0/6 Opinie: 1
- Stron:
- 432
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Opis ebooka: Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie
Ze względu na gwałtowny rozwój inżynierii danych, jaki nastąpił w ciągu ostatniej dekady, wielu inżynierów oprogramowania, badaczy i analityków danych zaczęło odczuwać potrzebę kompleksowego spojrzenia na tę praktykę. Dzięki tej praktycznej książce zawierającej opis najlepszych technologii dostępnych w ramach frameworka cyklu życia inżynierii danych, dowiesz się, jak planować i budować systemy, które mają zaspokoić potrzeby Twojej organizacji i klientów.
Autorzy, Joe Reis i Matt Housley, przeprowadzą Cię przez cykl życia inżynierii danych i pokażą, jak połączyć różne technologie chmurowe, aby spełnić potrzeby konsumentów danych w dolnej części strumienia przetwarzania. Dzięki lekturze tej książki dowiesz się, jak zastosować koncepcje generowania, pozyskiwania, orkiestracji, przekształcania, przechowywania i zarządzania danymi - kluczowe w każdym środowisku danych, niezależnie od wykorzystywanej technologii.
Dzięki książce:
- Uzyskasz zwięzły przegląd całego środowiska inżynierii danych.
- Nauczysz się oceniać problemy inżynierii danych i stosować kompleksowe frameworki najlepszych praktyk.
- Dowiesz się jak przebić się przez szum marketingowy i wybrać odpowiednie technologie, architekturę danych i procesy?
- Nauczysz się wykorzystywać cykl życia inżynierii danych do zaprojektowania i zbudowania solidnej architektury.
- Poznasz mechanizmy zarządzania danymi i bezpieczeństwa w całym cyklu życia inżynierii danych.
"Świat danych ewoluuje już od jakiegoś czasu. Najpierw byli projektanci. Następnie administratorzy baz danych. Potem CIO. Następnie architekci danych. Ta książka sygnalizuje kolejny krok w ewolucji i dojrzałości branży. Jest to lektura obowiązkowa dla każdego, kto uczciwie podchodzi do swojego zawodu i kariery".
Bill Inmon, twórca hurtowni danych
"Inżynieria danych w praktyce" to świetne wprowadzenie do branży przenoszenia, przetwarzania i obsługi danych. Gorąco polecam ją każdemu, kto chce być na bieżąco z inżynierią danych lub analizą oraz wszystkim osobom zajmującym się danymi, którzy chcą uzupełnić luki w swojej wiedzy".
Jordan Tigani, założyciel i dyrektor generalny firmy MotherDuck oraz inżynier-założyciel i współtwórca firmy BigQuery
Ze względu na gwałtowny rozwój inżynierii danych, jaki nastąpił w ciągu ostatniej dekady, wielu inżynierów oprogramowania, badaczy i analityków danych zaczęło odczuwać potrzebę kompleksowego spojrzenia na tę praktykę. Dzięki tej praktycznej książce zawierającej opis najlepszych technologii dostępnych w ramach frameworka cyklu życia inżynierii danych, dowiesz się, jak planować i budować systemy, które mają zaspokoić potrzeby Twojej organizacji i klientów.
Autorzy, Joe Reis i Matt Housley, przeprowadzą Cię przez cykl życia inżynierii danych i pokażą, jak połączyć różne technologie chmurowe, aby spełnić potrzeby konsumentów danych w dolnej części strumienia przetwarzania. Dzięki lekturze tej książki dowiesz się, jak zastosować koncepcje generowania, pozyskiwania, orkiestracji, przekształcania, przechowywania i zarządzania danymi — kluczowe w każdym środowisku danych, niezależnie od wykorzystywanej technologii.
Dzięki książce:
- Uzyskasz zwięzły przegląd całego środowiska inżynierii danych.
- Nauczysz się oceniać problemy inżynierii danych i stosować kompleksowe frameworki najlepszych praktyk.
- Dowiesz się jak przebić się przez szum marketingowy i wybrać odpowiednie technologie, architekturę danych i procesy?
- Nauczysz się wykorzystywać cykl życia inżynierii danych do zaprojektowania i zbudowania solidnej architektury.
- Poznasz mechanizmy zarządzania danymi i bezpieczeństwa w całym cyklu życia inżynierii danych.
„Świat danych ewoluuje już od jakiegoś czasu. Najpierw byli projektanci. Następnie administratorzy baz danych. Potem CIO. Następnie architekci danych. Ta książka sygnalizuje kolejny krok w ewolucji i dojrzałości branży. Jest to lektura obowiązkowa dla każdego, kto uczciwie podchodzi do swojego zawodu i kariery”.
Bill Inmon, twórca hurtowni danych
„Inżynieria danych w praktyce" to świetne wprowadzenie do branży przenoszenia, przetwarzania i obsługi danych. Gorąco polecam ją każdemu, kto chce być na bieżąco z inżynierią danych lub analizą oraz wszystkim osobom zajmującym się danymi, którzy chcą uzupełnić luki w swojej wiedzy”.
Jordan Tigani, założyciel i dyrektor generalny firmy MotherDuck oraz inżynier–założyciel i współtwórca firmy BigQuery
Wybrane bestsellery
-
Data engineering has grown rapidly in the past decade, leaving many software engineers, data scientists, and analysts looking for a comprehensive view of this practice. With this practical book, you'll learn how to plan and build systems to serve the needs of your organization and customers by ev...(245.65 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
Mastering Data transformation is essential for enhancing their data models and business intelligence. The Definitive Guide to Power Query equips you with the knowledge and skills to master the tool while leveraging its remarkable capabilities.
The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query
Gregory Deckler, Rick de Groot, Melissa de Korte, Brian Julius
-
Jeśli w swojej pracy masz lub miewasz do czynienia z danymi, z pewnością orientujesz się, że do tego celu stworzono dotąd całkiem sporo narzędzi. Nic dziwnego – przy tej liczbie danych, z jaką spotykamy się w dzisiejszym cyfrowym świecie, zdolność do ich sprawnego analizowania i wyciągania ...
Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym
(39.90 zł najniższa cena z 30 dni)39.90 zł
139.00 zł(-71%) -
Dzisiejszą gospodarką rządzi informacja. Kto potrafi ją wyłuskać z zalewu danych, ten zyskuje konkurencyjną przewagę. Świadomi tego twórcy oprogramowania komputerowego stworzyli szereg narzędzi służących wyszukiwaniu informacji, ich przetwarzaniu, analizowaniu i prezentowaniu w sposób dostępny dl...
Elasticsearch. Kurs video. Pozyskiwanie i analiza danych Elasticsearch. Kurs video. Pozyskiwanie i analiza danych
(39.90 zł najniższa cena z 30 dni)99.59 zł
249.00 zł(-60%) -
Power Apps to platforma stworzona przez Microsoft, umożliwiająca łatwe projektowanie, tworzenie i dostosowywanie aplikacji bez konieczności posiadania głębokiej wiedzy programistycznej. Z użyciem Power Apps można budować niestandardowe aplikacje, które efektywnie wspierają i automatyzują różne pr...
Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code
(39.90 zł najniższa cena z 30 dni)69.65 zł
199.00 zł(-65%) -
Tę książkę docenią wszyscy zainteresowani eksploracją danych i uczeniem maszynowym, którzy chcieliby pewnie poruszać się w świecie nauki o danych. Pokazano tu, w jaki sposób Excel pozwala zobrazować proces ich eksplorowania i jak działają poszczególne techniki w tym zakresie. Przejrzyście wyjaśni...
Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku
(40.20 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
Ta książka będzie świetnym uzupełnieniem wiedzy o Flutterze i Darcie, sprawdzi się również jako wsparcie podczas rozwiązywania konkretnych problemów. Znalazło się tu ponad sto receptur, dzięki którym poznasz tajniki pisania efektywnego kodu, korzystania z narzędzi udostępnianych przez framework F...
Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Czy chcesz szybko i skutecznie opanować podstawy Microsoft Azure, zrozumieć jego architekturę i możliwości? W takim razie to książka dla Ciebie! Czy chcesz nauczyć się, jak wdrażać, zarządzać i skalować aplikacje w chmurze Azure, nie tracąc przy tym cennego czasu? W takim razie to książka dla C...
Azure w 1 dzień. Microsoft Azure od podstaw po zaawansowane techniki Azure w 1 dzień. Microsoft Azure od podstaw po zaawansowane techniki
-
Oto zwięzłe i równocześnie praktyczne kompendium, w którym znajdziesz 20 praktyk udanego planowania, analizy, specyfikacji, walidacji i zarządzania wymaganiami. Praktyki te są odpowiednie dla projektów zarządzanych zarówno w tradycyjny, jak i zwinny sposób, niezależnie od branży. Sprawią, że zesp...
Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej
(40.20 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
W dzisiejszej praktyce biznesowej duże znaczenie mają dane i ich analiza. W analizie zastosowanie znajduje wiele modeli statystycznych, implementowanych w różnych programach komputerowych. Na przykład Excel ma specjalny dodatek, nazwany po prostu Analiza Danych. Bardzo popularne narzędzie stanowi...
R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych
(39.90 zł najniższa cena z 30 dni)74.50 zł
149.00 zł(-50%)
O autorach ebooka
Joe Reis - jest „badaczem danych z odzysku” oraz inżynierem danych i architektem.
Matt Housley - jest konsultantem w dziedzinie inżynierii danych i specjalistą ds. chmury.
Zobacz pozostałe książki z serii O'Reilly
-
Dzięki tej książce zrozumiesz bazowe koncepcje programowania funkcyjnego i przekonasz się, że możesz włączać je do kodu bez rezygnacji z paradygmatu obiektowego. Dowiesz się również, kiedy w swojej codziennej pracy używać takich opcji jak niemutowalność i funkcje czyste i dlaczego warto to robić....
Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego
(52.20 zł najniższa cena z 30 dni)60.90 zł
87.00 zł(-30%) -
To drugie, zaktualizowane wydanie przewodnika po systemie Prometheus. Znajdziesz w nim wyczerpujące wprowadzenie do tego oprogramowania, a także wskazówki dotyczące monitorowania aplikacji i infrastruktury, tworzenia wykresów, przekazywania ostrzeżeń, bezpośredniej instrumentacji kodu i pobierani...
Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Ten przewodnik, który docenią programiści i architekci, zawiera wyczerpujące omówienie zagadnień projektowania, funkcjonowania i modyfikowania architektury API. Od strony praktycznej przedstawia strategie budowania i testowania API REST umożliwiającego połączenie oferowanej funkcjonalności na poz...
Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
W tej książce omówiono ponad 20 najprzydatniejszych wzorców projektowych, dzięki którym tworzone aplikacje internetowe będą łatwe w późniejszej obsłudze technicznej i w trakcie skalowania. Poza wzorcami projektowymi przedstawiono wzorce generowania i wydajności działania, których znaczenie dla uż...
Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
To gruntownie zaktualizowane i uzupełnione wydanie praktycznego przewodnika po wdrażaniu i testowaniu kontenerów Dockera. Przedstawia proces przygotowania pakietu aplikacji ze wszystkimi ich zależnościami, a także jego testowania, wdrażania, skalowania i utrzymywania w środowiskach produkcyjnych....
Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III
(52.20 zł najniższa cena z 30 dni)60.90 zł
87.00 zł(-30%) -
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...
Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie
(46.20 zł najniższa cena z 30 dni)53.90 zł
77.00 zł(-30%) -
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięk...
Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II
(77.40 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%) -
Oto kolejne wydanie zwięzłego podręcznika dla programistów Javy, który ma ułatwić maksymalne wykorzystanie technologii tego języka w wersji 17. Treść została skrupulatnie przejrzana i uzupełniona o materiał dotyczący nowości w obiektowym modelu Javy. Pierwsza część książki obejmuje wprowadzenie d...(53.40 zł najniższa cena z 30 dni)
62.30 zł
89.00 zł(-30%) -
Dzięki tej książce dowiesz się, w jaki sposób uczynić architekturę oprogramowania wystarczająco plastyczną, aby mogła odzwierciedlać zachodzące zmiany biznesowe i technologiczne. W nowym wydaniu rozbudowano pojęcia zmiany kierowanej i przyrostowej, a także przedstawiono najnowsze techniki dotyczą...
Architektura ewolucyjna. Projektowanie oprogramowania i wsparcie zmian. Wydanie II Architektura ewolucyjna. Projektowanie oprogramowania i wsparcie zmian. Wydanie II
(40.20 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
Oto zwięzły i praktyczny przewodnik po usłudze GA4 i jej integracji z chmurą. Szczególnie skorzystają z niego analitycy danych, biznesu i marketingu. Opisano tu wszystkie istotne kwestie dotyczące tego nowego, potężnego modelu analitycznego. Szczególną uwagę poświęcono bardziej zaawansowanym funk...
Google Analytics od podstaw. Analiza wpływu biznesowego i wyznaczanie trendów Google Analytics od podstaw. Analiza wpływu biznesowego i wyznaczanie trendów
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%)
Ebooka "Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Fundamentals of Data Engineering: Plan and Build Robust Data Systems
- Tłumaczenie:
- Radosław Meryk
- ISBN Książki drukowanej:
- 978-83-832-2154-0, 9788383221540
- Data wydania książki drukowanej:
- 2023-06-27
- ISBN Ebooka:
- 978-83-832-2155-7, 9788383221557
- Data wydania ebooka:
- 2023-06-27 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 165x235
- Numer z katalogu:
- 195435
- Rozmiar pliku Pdf:
- 6.2MB
- Rozmiar pliku ePub:
- 8.2MB
- Rozmiar pliku Mobi:
- 16.3MB
- Pobierz przykładowy rozdział PDF
- Zgłoś erratę
- Serie wydawnicze: O'Reilly
Spis treści ebooka
- 1. Czym jest inżynieria danych?
- Czym jest inżynieria danych?
- Definicja inżynierii danych
- Cykl życia inżynierii danych
- Ewolucja inżyniera danych
- Inżynieria danych a nauka o danych
- Umiejętności w zakresie inżynierii danych i wykonywane działania
- Znaczenie dojrzałości danych dla inżyniera danych
- Umiejętności inżyniera danych
- Obowiązki biznesowe
- Obowiązki techniczne
- Kontinuum ról inżynierii danych od A do B
- Inżynierowie danych wewnątrz organizacji
- Inżynierowie danych wewnętrznych systemów firmy a inżynierowie danych systemów zewnętrznych
- Inżynierowie danych a inne role techniczne
- Inżynierowie danych a kierownictwo biznesowe
- Podsumowanie
- Zasoby dodatkowe
- Czym jest inżynieria danych?
- 2. Cykl życia inżynierii danych
- Czym jest cykl życia inżynierii danych?
- Cykl życia danych a cykl życia inżynierii danych
- Generowanie - systemy źródłowe
- Przechowywanie
- Pozyskiwanie
- Przekształcanie
- Serwowanie danych
- Główne nurty w cyklu życia inżynierii danych
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- Czym jest cykl życia inżynierii danych?
- 3. Projektowanie dobrej architektury danych
- Czym jest architektura danych?
- Definicja architektury korporacyjnej
- Definicja architektury danych
- "Dobra" architektura danych
- Zasady dobrej architektury danych
- Zasada 1. Mądrze dobieraj wspólne komponenty
- Zasada 2. Przygotuj się na awarie
- Zasada 3. Tworzenie architektury z myślą o skalowalności
- Zasada 4. Architektura to przywództwo
- Zasada 5. Pracuj nad architekturą ciągle
- Zasada 6. Buduj luźno powiązane systemy
- Zasada 7. Podejmuj odwracalne decyzje
- Zasada 8. Traktuj bezpieczeństwo priorytetowo
- Zasada 9. Korzystaj z FinOps
- Główne pojęcia dotyczące architektury danych
- Dziedziny i usługi
- Systemy rozproszone, skalowalność i projektowanie z uwzględnieniem awarii
- Sprzężenia ścisłe a sprzężenia luźne: warstwy, monolity i mikrousługi
- Dostęp użytkowników - pojedynczy użytkownik a wielodostęp
- Architektura sterowana zdarzeniami
- Projekty typu brownfield kontra projekty typu greenfield
- Przykłady i typy architektury danych
- Hurtownia danych
- Jeziora danych
- Konwergencja, jeziora danych nowej generacji i platforma danych
- Nowoczesny stos danych
- Architektura Lambda
- Architektura Kappa
- Model przepływu danych oraz ujednolicone przetwarzanie wsadowe i strumieniowe
- Architektura dla IoT
- Siatka danych
- Przykłady innych architektur danych
- Kto jest zaangażowany w projektowanie architektury danych?
- Podsumowanie
- Zasoby dodatkowe
- Czym jest architektura danych?
- 4. Wybór technologii w całym cyklu życia inżynierii danych
- Wielkość i możliwości zespołu
- Szybkość wprowadzania produktów na rynek
- Interoperacyjność
- Optymalizacja kosztów i wartości biznesowej
- Całkowity koszt posiadania
- Całkowity koszt alternatywny posiadania
- FinOps
- Teraźniejszość kontra przyszłość - technologie niezmienne kontra przejściowe
- Nasza rada
- Lokalizacja
- Lokalnie
- Chmura
- Chmura hybrydowa
- Rozwiązania wielochmurowe
- Decentralizacja. Blockchain i przetwarzanie brzegowe
- Nasza rada
- Argumenty za "repatriacją" z chmury
- Budowanie zamiast kupowania
- Oprogramowanie open source
- Własne ogrody otoczone murem
- Nasza rada
- Monolit czy rozwiązanie modułowe
- Monolit
- Architektura modułowa
- Wzorzec rozproszonego monolitu
- Nasza rada
- Rozwiązania bezserwerowe kontra rozwiązania oparte na serwerach
- Rozwiązania bezserwerowe
- Kontenery
- Jak ocenić rozwiązanie serwerowe w porównaniu z bezserwerowym?
- Nasza rada
- Optymalizacja, wydajność i wojny testów porównawczych
- Big data. na lata dziewięćdziesiąte
- Bezsensowne porównania kosztów
- Asymetryczna optymalizacja
- Niech kupujący się strzeże
- Nurty cyklu życia inżynierii danych i ich wpływ na wybór technologii
- Zarządzanie danymi
- DataOps
- Architektura danych
- Przykład orkiestracji - Airflow
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- 5. Generowanie danych w systemach źródłowych
- Źródła danych - jak tworzone są dane?
- Systemy źródłowe. Najważniejsze pojęcia
- Pliki i dane bez struktury
- Interfejsy API
- Bazy danych aplikacji (systemy OLTP)
- Systemy przetwarzania analitycznego online (OLAP)
- Przechwytywanie zdarzeń zmiany danych
- Logi
- Logi bazy danych
- CRUD
- Tylko wstawianie
- Komunikaty i strumienie
- Rodzaje czasu
- Praktyczne szczegóły dotyczące systemów źródłowych
- Bazy danych
- Interfejsy API
- Współdzielenie danych
- Zewnętrzne źródła danych
- Kolejki komunikatów i platformy strumieniowego przesyłania zdarzeń
- Z kim będziesz pracować?
- Nurty inżynierii danych i ich wpływ na systemy źródłowe
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- 6. Składowanie
- Podstawowe elementy systemów składowania danych
- Dyski magnetyczne
- Dyski SSD
- Pamięć operacyjna
- Infrastruktura sieci i procesor
- Serializacja
- Kompresja
- Buforowanie
- Systemy składowania danych
- Składowanie na pojedynczym serwerze a składowanie rozproszone
- Spójność ostateczna kontra spójność silna
- Składowanie w plikach
- Blokowe systemy składowania
- Magazyn obiektów
- Systemy składowania oparte na pamięci podręcznej i pamięci operacyjnej
- Rozproszony system plików Hadoop
- Składowanie strumieniowe
- Indeksy, partycjonowanie i klastrowanie
- Abstrakcje składowania w inżynierii danych
- Hurtownia danych
- Jeziora danych
- Data lakehouse
- Platformy danych
- Architektura pamięci masowej stream-to-batch
- Wielkie pomysły i trendy dotyczące składowania
- Katalog danych
- Współdzielenie danych
- Schemat
- Oddzielenie przetwarzania od składowania
- Cykl życia systemów składowania i utrzymywanie danych
- Magazyny dla jednego i wielu dzierżawców
- Z kim będziesz pracować?
- Główne nurty
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- Podstawowe elementy systemów składowania danych
- 7. Pozyskiwanie danych
- Czym jest pozyskiwanie danych?
- Kluczowe zagadnienia inżynieryjne dotyczące fazy pozyskiwania danych
- Dane związane kontra dane niezwiązane
- Częstość
- Pozyskiwanie synchroniczne a asynchroniczne
- Serializacja i deserializacja
- Przepustowość i skalowalność
- Niezawodność i trwałość
- Ładunek danych
- Wzorce pozyskiwania pull, push czy odpytywanie?
- Zagadnienia dotyczące pozyskiwania danych partiami
- Ekstrakcja migawkowa lub różnicowa
- Eksportowanie i pozyskiwanie oparte na plikach
- Systemy ETL kontra ELT
- Wstawianie, aktualizacje i rozmiar partii
- Migracje danych
- Zagadnienia dotyczące pozyskiwania komunikatów i pozyskiwania strumieniowego
- Ewolucje schematu
- Spóźnione dane
- Kolejność zdarzeń i wielokrotne dostarczanie
- Ponowne odtwarzanie
- Czas życia
- Rozmiar wiadomości
- Obsługa błędów i kolejki utraconych wiadomości
- Konsumenci typu pull kontra konsumenci typu push
- Lokalizacja
- Sposoby pozyskiwania danych
- Bezpośrednie połączenie z bazą danych
- Przechwytywanie zdarzeń zmian danych
- Interfejsy API
- Kolejki komunikatów i platformy strumieniowego przesyłania zdarzeń
- Zarządzane łączniki danych
- Przenoszenie danych za pomocą obiektowego magazynu danych
- EDI
- Bazy danych i eksportowanie plików
- Problemy z popularnymi formatami plików
- Powłoka
- SSH
- SFTP i SCP
- Webhooki
- Interfejs webowy
- Web scraping
- Urządzenia do przesyłania danych wykorzystywane do migracji
- Współdzielenie danych
- Z kim będziesz pracować?
- Interesariusze w górnej części strumienia przetwarzania
- Interesariusze z dolnej części strumienia przetwarzania
- Główne nurty
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- 8. Zapytania, modelowanie i przekształcenia
- Zapytania
- Czym jest zapytanie?
- Cykl życia zapytania
- Optymalizator zapytań
- Poprawa wydajności zapytań
- Zapytania do danych przekazywanych strumieniowo
- Modelowanie danych
- Co to jest model danych?
- Pojęciowe, logiczne i fizyczne modele danych
- Normalizacja
- Techniki modelowania danych analitycznych pozyskiwanych partiami
- Modelowanie danych pozyskiwanych strumieniowo
- Przekształcenia
- Przekształcenia wsadowe
- Widoki zmaterializowane, federacja i wirtualizacja zapytań
- Przekształcanie i przetwarzanie danych przekazywanych strumieniowo
- Z kim będziesz pracować?
- Interesariusze w górnej części strumienia przetwarzania
- Interesariusze z dolnej części strumienia przetwarzania
- Główne nurty
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- Zapytania
- 9. Serwowanie danych na potrzeby analizy, uczenia maszynowego i odwróconych procesów ETL
- Ogólne uwagi dotyczące serwowania danych
- Zaufanie
- Jaki jest przypadek użycia i kto jest użytkownikiem?
- Produkty danych
- Produkt samoobsługowy czy nie?
- Definicje danych i logika
- Siatki danych
- Analityka
- Analityka biznesowa
- Analityka operacyjna
- Analityka wbudowana
- Uczenie maszynowe
- Co inżynier danych powinien wiedzieć o ML?
- Sposoby serwowania danych na potrzeby analityki i uczenia maszynowego
- Wymiana za pomocą plików
- Bazy danych
- Systemy strumieniowe
- Zapytania federacyjne
- Współdzielenie danych
- Warstwy semantyki i metryk
- Serwowanie danych w notatnikach
- Odwrócony ETL
- Z kim będziesz pracować?
- Główne nurty
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- Ogólne uwagi dotyczące serwowania danych
- 10. Bezpieczeństwo i prywatność
- Ludzie
- Moc negatywnego myślenia
- Zawsze bądź paranoikiem
- Procesy
- Teatr bezpieczeństwa kontra nawyki bezpieczeństwa
- Aktywne zabezpieczenia
- Zasada najmniejszych uprawnień
- Wspólna odpowiedzialność w chmurze
- Zawsze twórz kopie zapasowe danych
- Przykładowa polityka bezpieczeństwa
- Technologia
- Wdrażanie poprawek i aktualizacji
- Szyfrowanie
- Logowanie, monitorowanie i ostrzeganie
- Dostęp do sieci
- Bezpieczeństwo niskopoziomowej inżynierii danych
- Podsumowanie
- Zasoby dodatkowe
- Ludzie
- 11. Przyszłość inżynierii danych
- Cykl życia inżynierii danych nie zniknie
- Zmniejszenie złożoności i rozwój łatwych w użyciu narzędzi danych
- System operacyjny danych w skali chmury i lepsza interoperacyjność
- Korporacyjna inżynieria danych
- Tytuły zawodowe i zakresy obowiązków będą się zmieniać.
- Ewolucja nowoczesnego stosu danych w kierunku stosu danych na żywo
- Stos danych na żywo
- Potoki strumieniowe i analityczne bazy danych czasu rzeczywistego
- Fuzja danych z aplikacjami
- Ścisłe sprzężenie zwrotne między aplikacjami a uczeniem maszynowym
- Dane ciemnej materii i rozwój. arkuszy kalkulacyjnych?!
- Podsumowanie
Przedmowa
Część I. Podstawy i bloki budulcowe
Część II. Cykl życia inżynierii danych w szczegółach
Część III. Bezpieczeństwo, prywatność i przyszłość inżynierii danych
A. Serializacja i kompresja. Szczegóły techniczne
B. Sieć w chmurze
Skorowidz
Helion - inne książki
-
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(57.84 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Dzięki tej przystępnej książce zrozumiesz metody działania wielkich modeli językowych i techniki szkolenia modeli generatywnych. Następnie zapoznasz się z przypadkami użycia, w których ChatGPT sprawdzi się najlepiej, a w efekcie zwiększy produktywność i kreatywność. Dowiesz się też, jak wchodzić ...
Generatywna sztuczna inteligencja z ChatGPT i modelami OpenAI. Podnieś swoją produktywność i innowacyjność za pomocą GPT3 i GPT4 Generatywna sztuczna inteligencja z ChatGPT i modelami OpenAI. Podnieś swoją produktywność i innowacyjność za pomocą GPT3 i GPT4
(51.35 zł najniższa cena z 30 dni)55.30 zł
79.00 zł(-30%) -
Ta książka jest przewodnikiem dla profesjonalistów do spraw cyberbezpieczeństwa. Przedstawia podstawowe zasady reagowania na incydenty bezpieczeństwa i szczegółowo, na przykładach, omawia proces tworzenia zdolności szybkiej i skutecznej reakcji na takie zdarzenia. Zaprezentowano tu techniki infor...
Informatyka śledcza. Narzędzia i techniki skutecznego reagowania na incydenty bezpieczeństwa. Wydanie III Informatyka śledcza. Narzędzia i techniki skutecznego reagowania na incydenty bezpieczeństwa. Wydanie III
(79.20 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%) -
Czy wiesz, co kryje się w centrum naszej Galaktyki? Czy zastanawiasz się czasem, jak powstają czarne dziury i co one oznaczają dla naszego zrozumienia wszechrzeczy? Czy chcesz poznać tajemnice tych niesamowitych obiektów, które wykraczają poza granice wyobraźni? Jeśli tak, to bestseller Czarne dz...(47.20 zł najniższa cena z 30 dni)
41.30 zł
59.00 zł(-30%) -
To piąte, gruntownie zaktualizowane wydanie podręcznika, który doceni każdy student informatyki i inżynier oprogramowania. Książka obejmuje szeroki zakres zagadnień, od podstawowych pojęć po zaawansowaną problematykę związaną z najnowszymi trendami w systemach operacyjnych. Wyczerpująco omawia pr...(143.20 zł najniższa cena z 30 dni)
125.30 zł
179.00 zł(-30%) -
Jak sądzisz, co stanowi bazę informatyki? Od czego powinien zacząć przyszły programista? Może od opanowania jednego z najpopularniejszych języków programowania? Oczywiście mógłby od tego rozpocząć, tyle że to trochę tak, jakby uczyć się korzystać z narzędzia bez świadomości, do czego ono właściwi...
Informacja i kodowanie. Krótkie wprowadzenie z przykładami zastosowań Informacja i kodowanie. Krótkie wprowadzenie z przykładami zastosowań
(47.20 zł najniższa cena z 30 dni)41.30 zł
59.00 zł(-30%) -
Oto drugie, zaktualizowane wydanie znakomitego przewodnika dla analityków danych. Dzięki niemu dowiesz się, w jaki sposób używać języka R do importowania, przekształcania i wizualizowania danych, a także do przekazywania uzyskanych wyników analizy. Nauczysz się też rozwiązywać najczęściej występu...
Język R w data science. Importowanie, porządkowanie, przekształcanie, wizualizowanie i modelowanie danych. Wydanie II Język R w data science. Importowanie, porządkowanie, przekształcanie, wizualizowanie i modelowanie danych. Wydanie II
(103.20 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%) -
Książkę szczególnie docenią analitycy bezpieczeństwa, którzy chcą się zapoznać z zestawem poleceń ARM i zdobyć wiedzę umożliwiającą im efektywne korzystanie z technik inżynierii wstecznej. Poza zestawem potrzebnych poleceń znalazło się w niej mnóstwo przydatnych informacji. Znajdziesz tu przegląd...
Niebieski lis. Polecenia procesorów Arm i inżynieria wsteczna Niebieski lis. Polecenia procesorów Arm i inżynieria wsteczna
(57.84 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Ewolucja formularzy internetowych zaczęła się od prostych znaczników języka HTML 2.0 opublikowanego w 1993 roku. Z czasem HTML oferował bardziej zaawansowane funkcje obsługi formularzy. Późniejsze wersje, HTML4, a następnie HTML5, wprowadziły nowe typy pól, takie jak pola daty, koloru czy też adr...
Angular i formularze reaktywne. Praktyczny przewodnik Angular i formularze reaktywne. Praktyczny przewodnik
(44.85 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Tę książkę docenią praktycy: inżynierowie uczenia maszynowego i analitycy danych, poszukujący sposobu praktycznego zaadaptowania modeli transformacyjnych do swoich potrzeb. Autorzy skupili się na praktycznej stronie tworzenia aplikacji językowych, a w poszczególnych rozdziałach ujęto wszystkie na...
Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face
(59.40 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie Joe Reis, Matt Housley (1) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.
(0)
(0)
(0)
(1)
(0)
(0)