Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie
- Ocena:
- 3.0/6 Opinie: 1
- Stron:
- 432
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Opis ebooka: Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie
Ze względu na gwałtowny rozwój inżynierii danych, jaki nastąpił w ciągu ostatniej dekady, wielu inżynierów oprogramowania, badaczy i analityków danych zaczęło odczuwać potrzebę kompleksowego spojrzenia na tę praktykę. Dzięki tej praktycznej książce zawierającej opis najlepszych technologii dostępnych w ramach frameworka cyklu życia inżynierii danych, dowiesz się, jak planować i budować systemy, które mają zaspokoić potrzeby Twojej organizacji i klientów.
Autorzy, Joe Reis i Matt Housley, przeprowadzą Cię przez cykl życia inżynierii danych i pokażą, jak połączyć różne technologie chmurowe, aby spełnić potrzeby konsumentów danych w dolnej części strumienia przetwarzania. Dzięki lekturze tej książki dowiesz się, jak zastosować koncepcje generowania, pozyskiwania, orkiestracji, przekształcania, przechowywania i zarządzania danymi - kluczowe w każdym środowisku danych, niezależnie od wykorzystywanej technologii.
Dzięki książce:
- Uzyskasz zwięzły przegląd całego środowiska inżynierii danych.
- Nauczysz się oceniać problemy inżynierii danych i stosować kompleksowe frameworki najlepszych praktyk.
- Dowiesz się jak przebić się przez szum marketingowy i wybrać odpowiednie technologie, architekturę danych i procesy?
- Nauczysz się wykorzystywać cykl życia inżynierii danych do zaprojektowania i zbudowania solidnej architektury.
- Poznasz mechanizmy zarządzania danymi i bezpieczeństwa w całym cyklu życia inżynierii danych.
"Świat danych ewoluuje już od jakiegoś czasu. Najpierw byli projektanci. Następnie administratorzy baz danych. Potem CIO. Następnie architekci danych. Ta książka sygnalizuje kolejny krok w ewolucji i dojrzałości branży. Jest to lektura obowiązkowa dla każdego, kto uczciwie podchodzi do swojego zawodu i kariery".
Bill Inmon, twórca hurtowni danych
"Inżynieria danych w praktyce" to świetne wprowadzenie do branży przenoszenia, przetwarzania i obsługi danych. Gorąco polecam ją każdemu, kto chce być na bieżąco z inżynierią danych lub analizą oraz wszystkim osobom zajmującym się danymi, którzy chcą uzupełnić luki w swojej wiedzy".
Jordan Tigani, założyciel i dyrektor generalny firmy MotherDuck oraz inżynier-założyciel i współtwórca firmy BigQuery
Ze względu na gwałtowny rozwój inżynierii danych, jaki nastąpił w ciągu ostatniej dekady, wielu inżynierów oprogramowania, badaczy i analityków danych zaczęło odczuwać potrzebę kompleksowego spojrzenia na tę praktykę. Dzięki tej praktycznej książce zawierającej opis najlepszych technologii dostępnych w ramach frameworka cyklu życia inżynierii danych, dowiesz się, jak planować i budować systemy, które mają zaspokoić potrzeby Twojej organizacji i klientów.
Autorzy, Joe Reis i Matt Housley, przeprowadzą Cię przez cykl życia inżynierii danych i pokażą, jak połączyć różne technologie chmurowe, aby spełnić potrzeby konsumentów danych w dolnej części strumienia przetwarzania. Dzięki lekturze tej książki dowiesz się, jak zastosować koncepcje generowania, pozyskiwania, orkiestracji, przekształcania, przechowywania i zarządzania danymi — kluczowe w każdym środowisku danych, niezależnie od wykorzystywanej technologii.
Dzięki książce:
- Uzyskasz zwięzły przegląd całego środowiska inżynierii danych.
- Nauczysz się oceniać problemy inżynierii danych i stosować kompleksowe frameworki najlepszych praktyk.
- Dowiesz się jak przebić się przez szum marketingowy i wybrać odpowiednie technologie, architekturę danych i procesy?
- Nauczysz się wykorzystywać cykl życia inżynierii danych do zaprojektowania i zbudowania solidnej architektury.
- Poznasz mechanizmy zarządzania danymi i bezpieczeństwa w całym cyklu życia inżynierii danych.
„Świat danych ewoluuje już od jakiegoś czasu. Najpierw byli projektanci. Następnie administratorzy baz danych. Potem CIO. Następnie architekci danych. Ta książka sygnalizuje kolejny krok w ewolucji i dojrzałości branży. Jest to lektura obowiązkowa dla każdego, kto uczciwie podchodzi do swojego zawodu i kariery”.
Bill Inmon, twórca hurtowni danych
„Inżynieria danych w praktyce" to świetne wprowadzenie do branży przenoszenia, przetwarzania i obsługi danych. Gorąco polecam ją każdemu, kto chce być na bieżąco z inżynierią danych lub analizą oraz wszystkim osobom zajmującym się danymi, którzy chcą uzupełnić luki w swojej wiedzy”.
Jordan Tigani, założyciel i dyrektor generalny firmy MotherDuck oraz inżynier–założyciel i współtwórca firmy BigQuery
Wybrane bestsellery
-
Data engineering has grown rapidly in the past decade, leaving many software engineers, data scientists, and analysts looking for a comprehensive view of this practice. With this practical book, you'll learn how to plan and build systems to serve the needs of your organization and customers by ev...(245.65 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
Tę książkę docenią wszyscy zainteresowani eksploracją danych i uczeniem maszynowym, którzy chcieliby pewnie poruszać się w świecie nauki o danych. Pokazano tu, w jaki sposób Excel pozwala zobrazować proces ich eksplorowania i jak działają poszczególne techniki w tym zakresie. Przejrzyście wyjaśni...
Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku
(40.20 zł najniższa cena z 30 dni)43.55 zł
67.00 zł(-35%) -
Power Apps to platforma stworzona przez Microsoft, umożliwiająca łatwe projektowanie, tworzenie i dostosowywanie aplikacji bez konieczności posiadania głębokiej wiedzy programistycznej. Z użyciem Power Apps można budować niestandardowe aplikacje, które efektywnie wspierają i automatyzują różne pr...
Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code
(39.90 zł najniższa cena z 30 dni)129.35 zł
199.00 zł(-35%) -
Ta książka będzie świetnym uzupełnieniem wiedzy o Flutterze i Darcie, sprawdzi się również jako wsparcie podczas rozwiązywania konkretnych problemów. Znalazło się tu ponad sto receptur, dzięki którym poznasz tajniki pisania efektywnego kodu, korzystania z narzędzi udostępnianych przez framework F...
Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Czy chcesz szybko i skutecznie opanować podstawy Microsoft Azure, zrozumieć jego architekturę i możliwości? W takim razie to książka dla Ciebie! Czy chcesz nauczyć się, jak wdrażać, zarządzać i skalować aplikacje w chmurze Azure, nie tracąc przy tym cennego czasu? W takim razie to książka dla C...
Azure w 1 dzień. Microsoft Azure od podstaw po zaawansowane techniki Azure w 1 dzień. Microsoft Azure od podstaw po zaawansowane techniki
-
Oto zwięzłe i równocześnie praktyczne kompendium, w którym znajdziesz 20 praktyk udanego planowania, analizy, specyfikacji, walidacji i zarządzania wymaganiami. Praktyki te są odpowiednie dla projektów zarządzanych zarówno w tradycyjny, jak i zwinny sposób, niezależnie od branży. Sprawią, że zesp...
Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej
(40.20 zł najniższa cena z 30 dni)53.60 zł
67.00 zł(-20%) -
W dzisiejszej praktyce biznesowej duże znaczenie mają dane i ich analiza. W analizie zastosowanie znajduje wiele modeli statystycznych, implementowanych w różnych programach komputerowych. Na przykład Excel ma specjalny dodatek, nazwany po prostu Analiza Danych. Bardzo popularne narzędzie stanowi...
R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych
(39.90 zł najniższa cena z 30 dni)74.50 zł
149.00 zł(-50%) -
Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywisteg...
Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
(65.40 zł najniższa cena z 30 dni)70.85 zł
109.00 zł(-35%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Ta książka jest trzecim, starannie zaktualizowanym wydaniem wyczerpującego przewodnika po narzędziach analitycznych Pythona. Uwzględnia Pythona 3.0 i bibliotekę pandas 1.4. Została napisana w przystępny sposób, a poszczególne zagadnienia bogato zilustrowano przykładami, studiami rzeczywistych prz...
Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III
(71.40 zł najniższa cena z 30 dni)77.35 zł
119.00 zł(-35%)
O autorach ebooka
Joe Reis - jest „badaczem danych z odzysku” oraz inżynierem danych i architektem.
Matt Housley - jest konsultantem w dziedzinie inżynierii danych i specjalistą ds. chmury.
Zobacz pozostałe książki z serii O'Reilly
-
Ten przewodnik, który docenią programiści i architekci, zawiera wyczerpujące omówienie zagadnień projektowania, funkcjonowania i modyfikowania architektury API. Od strony praktycznej przedstawia strategie budowania i testowania API REST umożliwiającego połączenie oferowanej funkcjonalności na poz...
Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
W tej książce omówiono ponad 20 najprzydatniejszych wzorców projektowych, dzięki którym tworzone aplikacje internetowe będą łatwe w późniejszej obsłudze technicznej i w trakcie skalowania. Poza wzorcami projektowymi przedstawiono wzorce generowania i wydajności działania, których znaczenie dla uż...
Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
To gruntownie zaktualizowane i uzupełnione wydanie praktycznego przewodnika po wdrażaniu i testowaniu kontenerów Dockera. Przedstawia proces przygotowania pakietu aplikacji ze wszystkimi ich zależnościami, a także jego testowania, wdrażania, skalowania i utrzymywania w środowiskach produkcyjnych....
Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III
(52.20 zł najniższa cena z 30 dni)56.55 zł
87.00 zł(-35%) -
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...
Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie
(46.20 zł najniższa cena z 30 dni)50.05 zł
77.00 zł(-35%) -
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięk...
Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II
(77.40 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
Oto kolejne wydanie zwięzłego podręcznika dla programistów Javy, który ma ułatwić maksymalne wykorzystanie technologii tego języka w wersji 17. Treść została skrupulatnie przejrzana i uzupełniona o materiał dotyczący nowości w obiektowym modelu Javy. Pierwsza część książki obejmuje wprowadzenie d...(53.40 zł najniższa cena z 30 dni)
57.84 zł
89.00 zł(-35%) -
Dzięki tej książce dowiesz się, w jaki sposób uczynić architekturę oprogramowania wystarczająco plastyczną, aby mogła odzwierciedlać zachodzące zmiany biznesowe i technologiczne. W nowym wydaniu rozbudowano pojęcia zmiany kierowanej i przyrostowej, a także przedstawiono najnowsze techniki dotyczą...
Architektura ewolucyjna. Projektowanie oprogramowania i wsparcie zmian. Wydanie II Architektura ewolucyjna. Projektowanie oprogramowania i wsparcie zmian. Wydanie II
(40.20 zł najniższa cena z 30 dni)43.55 zł
67.00 zł(-35%) -
Oto zwięzły i praktyczny przewodnik po usłudze GA4 i jej integracji z chmurą. Szczególnie skorzystają z niego analitycy danych, biznesu i marketingu. Opisano tu wszystkie istotne kwestie dotyczące tego nowego, potężnego modelu analitycznego. Szczególną uwagę poświęcono bardziej zaawansowanym funk...
Google Analytics od podstaw. Analiza wpływu biznesowego i wyznaczanie trendów Google Analytics od podstaw. Analiza wpływu biznesowego i wyznaczanie trendów
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Właśnie w tym celu powstał ten przewodnik po filozofii oprogramowania. Znajdziesz w nim 21 pragmatycznych reguł, którymi kierują się najlepsi programiści. Dzięki spostrzeżeniom zawartym w książce zmienisz podejście do programowania i szybko się przekonasz, że pozwoli Ci to na pisanie lepszego, cz...(47.40 zł najniższa cena z 30 dni)
51.35 zł
79.00 zł(-35%) -
Ta książka, napisana z myślą o inżynierach oprogramowania, jest trzecim, gruntownie zaktualizowanym wydaniem praktycznego przewodnika, który szybko przeprowadzi Cię od podstaw aż do zaawansowanych technik pracy z Gitem. Po zapoznaniu się z filozofią systemu i jego najważniejszymi funkcjami płynni...
Kontrola wersji z systemem Git. Zaawansowane narzędzia i techniki do wspólnego projektowania oprogramowania. Wydanie III Kontrola wersji z systemem Git. Zaawansowane narzędzia i techniki do wspólnego projektowania oprogramowania. Wydanie III
(71.40 zł najniższa cena z 30 dni)77.35 zł
119.00 zł(-35%)
Ebooka "Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Fundamentals of Data Engineering: Plan and Build Robust Data Systems
- Tłumaczenie:
- Radosław Meryk
- ISBN Książki drukowanej:
- 978-83-832-2154-0, 9788383221540
- Data wydania książki drukowanej:
- 2023-06-27
- ISBN Ebooka:
- 978-83-832-2155-7, 9788383221557
- Data wydania ebooka:
- 2023-06-27 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 165x235
- Numer z katalogu:
- 195435
- Rozmiar pliku Pdf:
- 6.2MB
- Rozmiar pliku ePub:
- 8.2MB
- Rozmiar pliku Mobi:
- 16.3MB
- Pobierz przykładowy rozdział PDF
- Zgłoś erratę
- Serie wydawnicze: O'Reilly
Spis treści ebooka
- 1. Czym jest inżynieria danych?
- Czym jest inżynieria danych?
- Definicja inżynierii danych
- Cykl życia inżynierii danych
- Ewolucja inżyniera danych
- Inżynieria danych a nauka o danych
- Umiejętności w zakresie inżynierii danych i wykonywane działania
- Znaczenie dojrzałości danych dla inżyniera danych
- Umiejętności inżyniera danych
- Obowiązki biznesowe
- Obowiązki techniczne
- Kontinuum ról inżynierii danych od A do B
- Inżynierowie danych wewnątrz organizacji
- Inżynierowie danych wewnętrznych systemów firmy a inżynierowie danych systemów zewnętrznych
- Inżynierowie danych a inne role techniczne
- Inżynierowie danych a kierownictwo biznesowe
- Podsumowanie
- Zasoby dodatkowe
- Czym jest inżynieria danych?
- 2. Cykl życia inżynierii danych
- Czym jest cykl życia inżynierii danych?
- Cykl życia danych a cykl życia inżynierii danych
- Generowanie - systemy źródłowe
- Przechowywanie
- Pozyskiwanie
- Przekształcanie
- Serwowanie danych
- Główne nurty w cyklu życia inżynierii danych
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- Czym jest cykl życia inżynierii danych?
- 3. Projektowanie dobrej architektury danych
- Czym jest architektura danych?
- Definicja architektury korporacyjnej
- Definicja architektury danych
- "Dobra" architektura danych
- Zasady dobrej architektury danych
- Zasada 1. Mądrze dobieraj wspólne komponenty
- Zasada 2. Przygotuj się na awarie
- Zasada 3. Tworzenie architektury z myślą o skalowalności
- Zasada 4. Architektura to przywództwo
- Zasada 5. Pracuj nad architekturą ciągle
- Zasada 6. Buduj luźno powiązane systemy
- Zasada 7. Podejmuj odwracalne decyzje
- Zasada 8. Traktuj bezpieczeństwo priorytetowo
- Zasada 9. Korzystaj z FinOps
- Główne pojęcia dotyczące architektury danych
- Dziedziny i usługi
- Systemy rozproszone, skalowalność i projektowanie z uwzględnieniem awarii
- Sprzężenia ścisłe a sprzężenia luźne: warstwy, monolity i mikrousługi
- Dostęp użytkowników - pojedynczy użytkownik a wielodostęp
- Architektura sterowana zdarzeniami
- Projekty typu brownfield kontra projekty typu greenfield
- Przykłady i typy architektury danych
- Hurtownia danych
- Jeziora danych
- Konwergencja, jeziora danych nowej generacji i platforma danych
- Nowoczesny stos danych
- Architektura Lambda
- Architektura Kappa
- Model przepływu danych oraz ujednolicone przetwarzanie wsadowe i strumieniowe
- Architektura dla IoT
- Siatka danych
- Przykłady innych architektur danych
- Kto jest zaangażowany w projektowanie architektury danych?
- Podsumowanie
- Zasoby dodatkowe
- Czym jest architektura danych?
- 4. Wybór technologii w całym cyklu życia inżynierii danych
- Wielkość i możliwości zespołu
- Szybkość wprowadzania produktów na rynek
- Interoperacyjność
- Optymalizacja kosztów i wartości biznesowej
- Całkowity koszt posiadania
- Całkowity koszt alternatywny posiadania
- FinOps
- Teraźniejszość kontra przyszłość - technologie niezmienne kontra przejściowe
- Nasza rada
- Lokalizacja
- Lokalnie
- Chmura
- Chmura hybrydowa
- Rozwiązania wielochmurowe
- Decentralizacja. Blockchain i przetwarzanie brzegowe
- Nasza rada
- Argumenty za "repatriacją" z chmury
- Budowanie zamiast kupowania
- Oprogramowanie open source
- Własne ogrody otoczone murem
- Nasza rada
- Monolit czy rozwiązanie modułowe
- Monolit
- Architektura modułowa
- Wzorzec rozproszonego monolitu
- Nasza rada
- Rozwiązania bezserwerowe kontra rozwiązania oparte na serwerach
- Rozwiązania bezserwerowe
- Kontenery
- Jak ocenić rozwiązanie serwerowe w porównaniu z bezserwerowym?
- Nasza rada
- Optymalizacja, wydajność i wojny testów porównawczych
- Big data. na lata dziewięćdziesiąte
- Bezsensowne porównania kosztów
- Asymetryczna optymalizacja
- Niech kupujący się strzeże
- Nurty cyklu życia inżynierii danych i ich wpływ na wybór technologii
- Zarządzanie danymi
- DataOps
- Architektura danych
- Przykład orkiestracji - Airflow
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- 5. Generowanie danych w systemach źródłowych
- Źródła danych - jak tworzone są dane?
- Systemy źródłowe. Najważniejsze pojęcia
- Pliki i dane bez struktury
- Interfejsy API
- Bazy danych aplikacji (systemy OLTP)
- Systemy przetwarzania analitycznego online (OLAP)
- Przechwytywanie zdarzeń zmiany danych
- Logi
- Logi bazy danych
- CRUD
- Tylko wstawianie
- Komunikaty i strumienie
- Rodzaje czasu
- Praktyczne szczegóły dotyczące systemów źródłowych
- Bazy danych
- Interfejsy API
- Współdzielenie danych
- Zewnętrzne źródła danych
- Kolejki komunikatów i platformy strumieniowego przesyłania zdarzeń
- Z kim będziesz pracować?
- Nurty inżynierii danych i ich wpływ na systemy źródłowe
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- 6. Składowanie
- Podstawowe elementy systemów składowania danych
- Dyski magnetyczne
- Dyski SSD
- Pamięć operacyjna
- Infrastruktura sieci i procesor
- Serializacja
- Kompresja
- Buforowanie
- Systemy składowania danych
- Składowanie na pojedynczym serwerze a składowanie rozproszone
- Spójność ostateczna kontra spójność silna
- Składowanie w plikach
- Blokowe systemy składowania
- Magazyn obiektów
- Systemy składowania oparte na pamięci podręcznej i pamięci operacyjnej
- Rozproszony system plików Hadoop
- Składowanie strumieniowe
- Indeksy, partycjonowanie i klastrowanie
- Abstrakcje składowania w inżynierii danych
- Hurtownia danych
- Jeziora danych
- Data lakehouse
- Platformy danych
- Architektura pamięci masowej stream-to-batch
- Wielkie pomysły i trendy dotyczące składowania
- Katalog danych
- Współdzielenie danych
- Schemat
- Oddzielenie przetwarzania od składowania
- Cykl życia systemów składowania i utrzymywanie danych
- Magazyny dla jednego i wielu dzierżawców
- Z kim będziesz pracować?
- Główne nurty
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- Podstawowe elementy systemów składowania danych
- 7. Pozyskiwanie danych
- Czym jest pozyskiwanie danych?
- Kluczowe zagadnienia inżynieryjne dotyczące fazy pozyskiwania danych
- Dane związane kontra dane niezwiązane
- Częstość
- Pozyskiwanie synchroniczne a asynchroniczne
- Serializacja i deserializacja
- Przepustowość i skalowalność
- Niezawodność i trwałość
- Ładunek danych
- Wzorce pozyskiwania pull, push czy odpytywanie?
- Zagadnienia dotyczące pozyskiwania danych partiami
- Ekstrakcja migawkowa lub różnicowa
- Eksportowanie i pozyskiwanie oparte na plikach
- Systemy ETL kontra ELT
- Wstawianie, aktualizacje i rozmiar partii
- Migracje danych
- Zagadnienia dotyczące pozyskiwania komunikatów i pozyskiwania strumieniowego
- Ewolucje schematu
- Spóźnione dane
- Kolejność zdarzeń i wielokrotne dostarczanie
- Ponowne odtwarzanie
- Czas życia
- Rozmiar wiadomości
- Obsługa błędów i kolejki utraconych wiadomości
- Konsumenci typu pull kontra konsumenci typu push
- Lokalizacja
- Sposoby pozyskiwania danych
- Bezpośrednie połączenie z bazą danych
- Przechwytywanie zdarzeń zmian danych
- Interfejsy API
- Kolejki komunikatów i platformy strumieniowego przesyłania zdarzeń
- Zarządzane łączniki danych
- Przenoszenie danych za pomocą obiektowego magazynu danych
- EDI
- Bazy danych i eksportowanie plików
- Problemy z popularnymi formatami plików
- Powłoka
- SSH
- SFTP i SCP
- Webhooki
- Interfejs webowy
- Web scraping
- Urządzenia do przesyłania danych wykorzystywane do migracji
- Współdzielenie danych
- Z kim będziesz pracować?
- Interesariusze w górnej części strumienia przetwarzania
- Interesariusze z dolnej części strumienia przetwarzania
- Główne nurty
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- 8. Zapytania, modelowanie i przekształcenia
- Zapytania
- Czym jest zapytanie?
- Cykl życia zapytania
- Optymalizator zapytań
- Poprawa wydajności zapytań
- Zapytania do danych przekazywanych strumieniowo
- Modelowanie danych
- Co to jest model danych?
- Pojęciowe, logiczne i fizyczne modele danych
- Normalizacja
- Techniki modelowania danych analitycznych pozyskiwanych partiami
- Modelowanie danych pozyskiwanych strumieniowo
- Przekształcenia
- Przekształcenia wsadowe
- Widoki zmaterializowane, federacja i wirtualizacja zapytań
- Przekształcanie i przetwarzanie danych przekazywanych strumieniowo
- Z kim będziesz pracować?
- Interesariusze w górnej części strumienia przetwarzania
- Interesariusze z dolnej części strumienia przetwarzania
- Główne nurty
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- Zapytania
- 9. Serwowanie danych na potrzeby analizy, uczenia maszynowego i odwróconych procesów ETL
- Ogólne uwagi dotyczące serwowania danych
- Zaufanie
- Jaki jest przypadek użycia i kto jest użytkownikiem?
- Produkty danych
- Produkt samoobsługowy czy nie?
- Definicje danych i logika
- Siatki danych
- Analityka
- Analityka biznesowa
- Analityka operacyjna
- Analityka wbudowana
- Uczenie maszynowe
- Co inżynier danych powinien wiedzieć o ML?
- Sposoby serwowania danych na potrzeby analityki i uczenia maszynowego
- Wymiana za pomocą plików
- Bazy danych
- Systemy strumieniowe
- Zapytania federacyjne
- Współdzielenie danych
- Warstwy semantyki i metryk
- Serwowanie danych w notatnikach
- Odwrócony ETL
- Z kim będziesz pracować?
- Główne nurty
- Bezpieczeństwo
- Zarządzanie danymi
- DataOps
- Architektura danych
- Orkiestracja
- Inżynieria oprogramowania
- Podsumowanie
- Zasoby dodatkowe
- Ogólne uwagi dotyczące serwowania danych
- 10. Bezpieczeństwo i prywatność
- Ludzie
- Moc negatywnego myślenia
- Zawsze bądź paranoikiem
- Procesy
- Teatr bezpieczeństwa kontra nawyki bezpieczeństwa
- Aktywne zabezpieczenia
- Zasada najmniejszych uprawnień
- Wspólna odpowiedzialność w chmurze
- Zawsze twórz kopie zapasowe danych
- Przykładowa polityka bezpieczeństwa
- Technologia
- Wdrażanie poprawek i aktualizacji
- Szyfrowanie
- Logowanie, monitorowanie i ostrzeganie
- Dostęp do sieci
- Bezpieczeństwo niskopoziomowej inżynierii danych
- Podsumowanie
- Zasoby dodatkowe
- Ludzie
- 11. Przyszłość inżynierii danych
- Cykl życia inżynierii danych nie zniknie
- Zmniejszenie złożoności i rozwój łatwych w użyciu narzędzi danych
- System operacyjny danych w skali chmury i lepsza interoperacyjność
- Korporacyjna inżynieria danych
- Tytuły zawodowe i zakresy obowiązków będą się zmieniać.
- Ewolucja nowoczesnego stosu danych w kierunku stosu danych na żywo
- Stos danych na żywo
- Potoki strumieniowe i analityczne bazy danych czasu rzeczywistego
- Fuzja danych z aplikacjami
- Ścisłe sprzężenie zwrotne między aplikacjami a uczeniem maszynowym
- Dane ciemnej materii i rozwój. arkuszy kalkulacyjnych?!
- Podsumowanie
Przedmowa
Część I. Podstawy i bloki budulcowe
Część II. Cykl życia inżynierii danych w szczegółach
Część III. Bezpieczeństwo, prywatność i przyszłość inżynierii danych
A. Serializacja i kompresja. Szczegóły techniczne
B. Sieć w chmurze
Skorowidz
Helion - inne książki
-
ChatGPT wywołał wstrząs w branży technologicznej. Programiści i wynalazcy otrzymali niesamowite możliwości dostępne na wyciągnięcie ręki. Interfejs API OpenAI i towarzyszące mu biblioteki stanowią gotowe rozwiązanie dla każdego twórcy aplikacji opartych na sztucznej inteligencji. Programista za p...
Tworzenie aplikacji z wykorzystaniem GPT-4 i ChatGPT. Buduj inteligentne chatboty, generatory treści i fascynujące projekty Tworzenie aplikacji z wykorzystaniem GPT-4 i ChatGPT. Buduj inteligentne chatboty, generatory treści i fascynujące projekty
(35.40 zł najniższa cena z 30 dni)38.35 zł
59.00 zł(-35%) -
Ta książka pomoże Ci się przygotować do pracy na stanowisku testera oprogramowania, a także zapewni wsparcie podczas wykonywania nowych zadań. Znajdziesz tu dokładne omówienie podstaw testowania, jego różnych rodzajów i poziomów w odniesieniu do zastosowania na różnych etapach pracy nad projektem...
Tester samouk. Praktyczny przewodnik po testowaniu oprogramowania na bazie gotowego projektu Tester samouk. Praktyczny przewodnik po testowaniu oprogramowania na bazie gotowego projektu
(35.40 zł najniższa cena z 30 dni)38.35 zł
59.00 zł(-35%) -
Czym jest inżynieria wymagań? To systematyczne podejście do pozyskiwania i dokumentowania wymagań, a także zarządzania nimi. Polega na zrozumieniu potrzeb i oczekiwań interesariuszy, a następnie opisaniu, za pomocą wymagań, systemu, który je spełnia.
Certyfikowany inżynier wymagań. Na podstawie IREB CPRE. Poziom podstawowy Certyfikowany inżynier wymagań. Na podstawie IREB CPRE. Poziom podstawowy
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Dzięki tej książce nauczysz się gromadzić publicznie dostępne informacje, korzystać z wiedzy o cyklu życia wrażliwych danych i przekształcać je w informacje wywiadowcze przydatne dla zespołów zajmujących się bezpieczeństwem. Opanujesz proces gromadzenia i analizy danych, poznasz również strategie...
Prawdziwa głębia OSINT. Odkryj wartość danych Open Source Intelligence Prawdziwa głębia OSINT. Odkryj wartość danych Open Source Intelligence
(59.40 zł najniższa cena z 30 dni)64.35 zł
99.00 zł(-35%) -
Oto kompleksowe omówienie sposobów wdrażania najnowszych dostępnych środków zabezpieczających systemy linuksowe. Z książki dowiesz się, jak skonfigurować laboratorium do ćwiczeń praktycznych, tworzyć konta użytkowników z odpowiednimi poziomami uprawnień, chronić dane dzięki uprawnieniom i szyfrow...
Bezpieczeństwo systemu Linux. Hardening i najnowsze techniki zabezpieczania przed cyberatakami. Wydanie III Bezpieczeństwo systemu Linux. Hardening i najnowsze techniki zabezpieczania przed cyberatakami. Wydanie III
(77.40 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
To dziewiąte wydanie znakomitego podręcznika programowania dla początkujących, starannie zaktualizowane i uzupełnione o informacje dotyczące Java Platform, Standard Edition 17. Książka rozpoczyna się od solidnej dawki wiedzy o kompilacji i uruchamianiu programu w Javie, słowach kluczowych i istot...(77.40 zł najniższa cena z 30 dni)
83.85 zł
129.00 zł(-35%) -
Jesteś specjalistą IT. I jesteś dobry w tym, co robisz. Masz wiedzę, doświadczenie, chcesz się nimi podzielić z innymi, pomóc im radzić sobie z problemami, które sam już dawno rozwiązałeś, może także zaprezentować się od tej strony przyszłym pracodawcom i zleceniodawcom, tylko... kto - poza Tobą ...
Marka osobista w branży IT. Jak ją zbudować i rozwijać Marka osobista w branży IT. Jak ją zbudować i rozwijać
(29.94 zł najniższa cena z 30 dni)32.43 zł
49.90 zł(-35%) -
MikroTik, łotewska firma z siedzibą w Rydze, od lat produkuje sprzęt sieciowy. Przystępna cena i świetna jakość sprawiły, że urządzenia sygnowane logo MikroTik zdobyły niezwykłą popularność - po produkty łotewskiej marki sięga się coraz częściej. Jeśli planujesz zmodernizować lub zbudować sieć i ...
Konfiguracja usług sieciowych na urządzeniach MikroTik Konfiguracja usług sieciowych na urządzeniach MikroTik
(47.40 zł najniższa cena z 30 dni)51.35 zł
79.00 zł(-35%) -
To drugie, zaktualizowane wydanie przewodnika po systemie Prometheus. Znajdziesz w nim wyczerpujące wprowadzenie do tego oprogramowania, a także wskazówki dotyczące monitorowania aplikacji i infrastruktury, tworzenia wykresów, przekazywania ostrzeżeń, bezpośredniej instrumentacji kodu i pobierani...
Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II
(53.40 zł najniższa cena z 30 dni)57.84 zł
89.00 zł(-35%) -
Dzięki tej książce zrozumiesz bazowe koncepcje programowania funkcyjnego i przekonasz się, że możesz włączać je do kodu bez rezygnacji z paradygmatu obiektowego. Dowiesz się również, kiedy w swojej codziennej pracy używać takich opcji jak niemutowalność i funkcje czyste i dlaczego warto to robić....
Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego
(52.20 zł najniższa cena z 30 dni)56.55 zł
87.00 zł(-35%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie Joe Reis, Matt Housley (1) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.
(0)
(0)
(0)
(1)
(0)
(0)