- Autor:
- Długość
- liczba lekcji: 42, czas trwania: 05:46:51
- Ocena
Kurs video
Databricks. Kurs video. Wstęp do architektury Data Lakehouse Piotr Chudzik
- Autor:
- Piotr Chudzik
- Wydawnictwo:
- Videopoint
- Wersja:
- Online
- Czas trwania:
- 5 godz. 46 min.
- Technologia:
- Databricks 15.4
- Ocena:
Spis lekcji kursu video
-
1. Wprowadzenie 00:37:44
-
2. Workspace i Data Explorer 00:40:30
-
3. Praca z notebookiem 00:54:50
- 3.1. Odczyt danych z DBFS 00:05:00
- 3.2. dbutils - nazwa użytkownika i notebooka 00:04:15
- 3.3. Widgety - tworzenie/usuwanie (Python) 00:12:45
- 3.4. Widgety - tworzenie/usuwanie (SQL + UI) 00:07:53
- 3.5. Widgety - pobieranie wartości 00:07:11
- 3.6. Funkcja %run 00:08:05
- 3.7. getAll/zasięg zmiennych 00:03:47
- 3.8. Podsumowanie rozdziału 00:05:54
-
4. Praca z formatem delta 01:37:48
- 4.1. Funkcja display() i _sqldf 00:08:50
- 4.2. Tworzenie/Usuwanie bazy danych 00:04:43
- 4.3. Zapis danych do formatu Delta 00:06:08
- 4.4. Tworzenie/Usuwanie tabeli 00:10:18
- 4.5. Polecenie MERGE INTO (SQL) 00:15:28
- 4.6. Polecenie MERGE INTO (Python) 00:14:00
- 4.7. Wersje danych/Odczyt katalogu z SQL 00:11:13
- 4.8. Polecenia ANALYZE TABLE/VACUUM 00:09:18
- 4.9. Polecenie ZORDER 00:09:20
- 4.10. Podsumowanie rozdziału 00:08:30
-
5. Konfiguracja środowiska 00:41:39
-
6. SQL Warehouse/Data Profiler 00:41:01
-
7. Automatyzacja zadań 00:42:09
Opis
kursu video
:
Databricks. Kurs video. Wstęp do architektury Data Lakehouse
Obierz kurs na... inżynierię danych
Jeśli myślisz o karierze inżyniera danych, ale nie masz doświadczenia w pracy na tym stanowisku, to ten kurs jest dla Ciebie idealną propozycją. Inżynier danych dostarcza je innym zespołom w firmie – usługę tę świadczy głównie dla analityków danych i dla data scientist. Do głównych obowiązków inżyniera danych należy tworzenie procesów ETL i ELT, walidacja danych i przygotowywanie ich poprzez budowanie systemu pobierania (na przykład strumienie danych lub orkiestracja zadań). Jego pracę ułatwiają i usprawniają odpowiednie narzędzia. Takie jak platforma analityczna Databricks.
Databricks stanowi jedno z najpopularniejszych rozwiązań służących przetwarzaniu, procesowaniu i analizie danych. Funkcjonuje ono, opierając się na własnym formacie danych, zwanym Delta. Specyfiką tej platformy jest to, że pozwala na tworzenie struktury danych podobnej do relacyjnych baz danych. Jeśli chcesz ją poznać i nauczysz się procesować w niej dane, zapraszamy na szkolenie. W jego trakcie omówimy podstawowe tematy związane z platformą Databricks – przede wszystkim kwestie dotyczące reguł pracy z notebookami i formatem Delta. Przyjrzysz się także kwestiom związanym z korzystaniem z innych modułów Databricks, takich jak SQL Warehouse, Workflows, czy zasadom tworzenia polityki klastra.
Co Cię czeka podczas naszego profesjonalnego szkolenia
Podczas kursu między innymi:
- Przygotujesz środowisko pracy
- Zaczniesz pracować z notebookami
- Przyjrzysz się sposobom korzystania z widgetów i „magic functions” w swoich zadaniach
- Będziesz tworzyć własne klastry obliczeniowe i ich polityki, a także uruchamiać na nich niezbędne biblioteki i skrypty
- Dowiesz się, czym jest dDBFS i jak odczytuje się z niego dane
- Poznasz format Delta
- Wykonasz polecenia SQL w ramach hurtowni danych i stworzysz na niej funkcje
- Zautomatyzujesz zadania za pomocą Workflows
- Zaprezentujesz dane za pomocą Dashboard
Databricks. Kurs video. Wstęp do architektury Data Lakehouse kończy się na poziomie podstawowym. Wiedza zdobyta w trakcie szkolenia pozwala na postawienie pierwszych kroków na platformie Databricks. Nabyte informacje oczywiście można zastosować w praktyce – na przykład w celu przeniesienia swojej pracy w języku Python, Scala, SQL i Spark do środowiska Databricks.
Wybrane bestsellery
Piotr Chudzik - pozostałe książki
Videopoint - inne książki
Dzięki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep@ebookpoint.pl
Książka drukowana
Oceny i opinie klientów: Databricks. Kurs video. Wstęp do architektury Data Lakehouse Piotr Chudzik (0) Weryfikacja opinii następuje na podstawie historii zamowień na koncie Użytkownika umiejszczającego opinię.