ODBIERZ TWÓJ BONUS :: »

Czyszczenie danych w Pythonie. Receptury. Nowoczesne techniki i narzędzia Pythona do wykrywania i eliminacji zanieczyszczeń oraz wydobywania kluczowych cech z danych Michael Walker

Autor:
Michael Walker
Serie wydawnicze:
Receptury
Wydawnictwo:
Helion
Wydawnictwo:
Helion
Ocena:
Bądź pierwszym, który oceni tę książkę
Stron:
328
Druk:
oprawa miękka
Dostępne formaty:
     PDF
     ePub
     Mobi
Czytaj fragment
Książka
niedostępna
Powiadom mnie, gdy książka będzie dostępna

Ebook
39,50 zł 79,00 zł (-50%)
39,50 zł najniższa cena z 30 dni

Dodaj do koszyka lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Powiadom o dostępności audiobooka »

Czego się nauczysz?

  • Importowania danych do pandas z różnych źródeł: CSV, Excel, bazy SQL, SPSS, Stata, SAS, R
  • Przechowywania i organizowania danych tablicowych oraz w formacie JSON
  • Importowania i oczyszczania danych z plików HTML i JSON, także przez API
  • Przeprowadzania wstępnej analizy danych i generowania statystyk podsumowujących
  • Wybierania, organizowania i selekcjonowania kolumn oraz wierszy danych
  • Wykrywania brakujących wartości i identyfikowania wartości odstających
  • Stosowania algorytmów k-najbliższych sąsiadów i Isolation Forest do znajdowania anomalii
  • Wykorzystywania wizualizacji (histogramy, wykresy pudełkowe, skrzypcowe, punktowe, liniowe, mapy ciepła) do analizy danych
  • Pracy z obiektami Series w pandas: pobierania, zmiany i oczyszczania wartości
  • Imputowania brakujących danych za pomocą różnych metod, w tym k-najbliższych sąsiadów
  • Grupowania, agregowania i przekształcania danych z użyciem groupby i funkcji NumPy
  • Łączenia ramek danych w różnych układach (jeden-do-jednego, jeden-do-wielu, wiele-do-wielu)
  • Usuwania duplikatów i naprawiania relacji wiele-do-wielu w danych
  • Zmiany kształtu danych z szerokich na długie i odwrotnie (stack, melt, unstack, pivot)
  • Tworzenia własnych funkcji i klas do automatyzacji oczyszczania i analizy danych
  • Automatyzowania identyfikacji anomalii, agregacji oraz aktualizacji wartości w danych

Przetwarzanie dużych ilości danych daje wiedzę, która leży u podstaw istotnych decyzji podejmowanych przez organizację. Pozwala to na uzyskiwanie znakomitych efektów: techniki wydobywania wiedzy z danych stają się coraz bardziej wyrafinowane. Podstawowym warunkiem sukcesu jest uzyskanie odpowiedniej jakości danych. Wykorzystanie niespójnych i niepełnych informacji prowadzi do podejmowania błędnych decyzji. Konsekwencją mogą być straty finansowe, stwarzanie konkretnych zagrożeń czy uszczerbek na wizerunku. A zatem oczyszczanie jest wyjątkowo ważną częścią analizy danych.

Ta książka jest praktycznym zbiorem gotowych do użycia receptur, podanych tak, aby maksymalnie ułatwić proces przygotowania danych do analizy. Omówiono tu takie kwestie dotyczące danych jak importowanie, ocena ich jakości, uzupełnianie braków, porządkowanie i agregacja, a także przekształcanie. Poza zwięzłym omówieniem tych zadań zaprezentowano najskuteczniejsze techniki ich wykonywania za pomocą różnych narzędzi: Pandas, NumPy, Matplotlib czy SciPy. W ramach każdej receptury wyjaśniono skutki podjętych działań. Cennym uzupełnieniem jest zestaw funkcji i klas zdefiniowanych przez użytkownika, które służą do automatyzacji oczyszczania danych. Umożliwiają one też dostrojenie procesu do konkretnych potrzeb.

W książce znajdziesz receptury, dzięki którym:

  • wczytasz i przeanalizujesz dane z różnych źródeł
  • uporządkujesz dane, poprawisz ich błędy i uzupełnisz braki
  • efektywnie skorzystasz z bibliotek Pythona
  • zastosujesz wizualizacje do analizy danych
  • napiszesz własne funkcje i klasy do automatyzacji procesu oczyszczania danych

Prawdziwą wartość mają tylko oczyszczone i spójne dane!

NIECH TWÓJ KOD ROZKWITNIE!

Wybrane bestsellery

O autorze książki

Michael Walker jest analitykiem danych. Od ponad trzydziestu lat zajmuje się tym zagadnieniem w różnych instytucjach edukacyjnych. Od 2006 roku prowadzi na wyższych uczelniach zajęcia z analizy danych, metod badawczych, statystyki i programowania. Poza tym tworzy raporty dla fundacji i sektora publicznego, a także publikuje analizy w czasopismach naukowych.

Zobacz pozostałe książki z serii Receptury

Helion - inne książki

Najczęściej zadawane pytania (FAQ)
1. Jakie umiejętności z zakresu Pythona są potrzebne, aby korzystać z książki ,,Czyszczenie danych w Pythonie. Receptury"?
Książka przeznaczona jest dla osób posiadających podstawową znajomość Pythona oraz podstaw pracy z bibliotekami takimi jak pandas czy NumPy. Nie wymaga zaawansowanej wiedzy programistycznej - receptury są praktyczne i szczegółowo opisane krok po kroku.
2. Czy książka zawiera gotowe przykłady kodu do wykorzystania w projektach?
Tak, każda receptura w książce zawiera gotowe fragmenty kodu, które można od razu wykorzystać lub dostosować do własnych potrzeb podczas pracy z danymi.
3. Jakie narzędzia i biblioteki Pythona są omawiane w tej książce?
Książka szczegółowo omawia zastosowanie najważniejszych narzędzi do czyszczenia danych: pandas, NumPy, Matplotlib, SciPy oraz przedstawia przykłady wykorzystania własnych funkcji i klas do automatyzacji procesów.
4. Czy książka obejmuje temat wizualizacji danych podczas czyszczenia?
Tak, jeden z rozdziałów poświęcony jest wykorzystaniu wizualizacji (m.in. histogramy, wykresy pudełkowe, mapy ciepła) do identyfikowania anomalii i nieoczekiwanych wartości w zbiorach danych.
5. Czy znajdę tu informacje, jak radzić sobie z danymi z różnych źródeł (np. CSV, Excel, bazy SQL)?
Tak, książka pokazuje, jak importować i oczyszczać dane pochodzące z różnych formatów i źródeł, takich jak pliki CSV, Excel, bazy SQL, JSON, HTML, a nawet dane eksportowane z innych programów statystycznych.
6. Czy receptury z książki można stosować w realnych projektach biznesowych?
Tak, przedstawione rozwiązania są praktyczne i sprawdzone w rzeczywistych zastosowaniach. Książka pomaga przygotować dane do analizy, co jest kluczowe w projektach biznesowych i naukowych.
7. Czy książka porusza temat automatyzacji procesu czyszczenia danych?
Tak, ostatni rozdział książki zawiera przykłady definiowania własnych funkcji i klas w Pythonie, które pozwalają zautomatyzować i usprawnić proces czyszczenia danych.
8. W jakiej formie dostępna jest książka - druk czy e-book?
Książka dostępna jest zarówno w wersji papierowej, jak i elektronicznej (e-book), co umożliwia wygodne korzystanie na różnych urządzeniach.

Zamknij

Przenieś na półkę
Dodano produkt na półkę
Usunięto produkt z półki
Przeniesiono produkt do archiwum
Przeniesiono produkt do biblioteki

Zamknij

Wybierz metodę płatności

Książka
79,00 zł
Niedostępna
Ebook
39,50 zł
Dodaj do koszyka
Płatności obsługuje:
Ikona płatności Alior Bank Ikona płatności Apple Pay Ikona płatności Bank PEKAO S.A. Ikona płatności Bank Pocztowy Ikona płatności Banki Spółdzielcze Ikona płatności BLIK Ikona płatności Crédit Agricole e-przelew Ikona płatności Google Pay Ikona płatności ING Bank Śląski Ikona płatności mBank Ikona płatności Millennium Ikona płatności Nest Bank Ikona płatności Paypal Ikona płatności PayPo | PayU Płacę później Ikona płatności PayU Płacę później Ikona płatności Plus Bank Ikona płatności Płacę z Citi Handlowy Ikona płatności Płać z BOŚ Ikona płatności Płatność online kartą płatniczą Ikona płatności Santander Ikona płatności Visa Mobile