Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II
- Ocena:
- 5.8/6 Opinie: 4
- Stron:
- 480
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Sprawdź nowe wydanie
Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III
Wes McKinney
Opis ebooka: Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II
Analiza danych stała się samodzielną dyscypliną wiedzy interesującą specjalistów z wielu branż: analityków biznesowych, statystyków, architektów oprogramowania czy też osoby zajmujące się sztuczną inteligencją. Wydobywanie informacji ze zbiorów danych pozwala na uzyskanie wiedzy niedostępnej w inny sposób. W tym celu dane trzeba odpowiednio przygotować, oczyścić, przetworzyć i oczywiście poddać analizie. Warto również zadbać o ich wizualizację. Do tych wszystkich zadań najlepiej wykorzystać specjalne narzędzia opracowane w języku Python.
Prezentowana książka jest drugim, zaktualizowanym i uzupełnionym, wydaniem klasycznego podręcznika napisanego z myślą o analitykach, którzy dotychczas nie pracowali w Pythonie, oraz o programistach Pythona, którzy nie zajmowali się dotąd analizą danych ani obliczeniami naukowymi. Przedstawiono tu możliwości oferowane przez Pythona 3.6 oraz najnowsze funkcje pakietów Pandas i NumPy, a także środowisk IPython i Jupyter. Przy opisie poszczególnych narzędzi analitycznych wyjaśniono ich działanie i zaprezentowano przykłady ich wykorzystania w sposób efektywny i kreatywny. Ta książka powinna się znaleźć w podręcznej bibliotece każdego analityka danych!
Najważniejsze zagadnienia:
- Eksploracja danych za pomocą powłoki IPython i środowiska Jupyter
- Korzystanie z pakietów NumPy i Pandas
- Tworzenie wizualizacji danych za pomocą pakietu Matplotlib
- Praca z danymi regularnych i nieregularnych szeregów czasowych
- Rozwiązywanie rzeczywistych problemów analitycznych
Python: poznaj idealne narzędzie do analizy danych!
Python w analizie danych
Naucz się przetwarzać, czyścić i analizować dane w Pythonie. Drugie wydanie tej książki zostało zaktualizowane pod kątem Pythona 3.6 i zawiera wiele praktycznych przykładów ilustrujących skuteczne sposoby rozwiązywania różnych problemów związanych z analizą danych. Dzięki lekturze tej książki nauczysz się korzystać ze wszystkich możliwości oferowanych przez najnowsze wersje pakietów pandas i NumPy, a także środowisk IPython i Jupyter.
Autorem tej książki jest Wes McKinney - twórca projektu pandas. Pozycja ta stanowi praktyczne i nowoczesne wprowadzenie do narzędzi analitycznych Pythona, Książka ta została napisana z myślą o analitykach, którzy nie pracowali dotychczas w Pythonie, a także programistach Pythona, którzy nie zajmowali się dotychczas analizą danych i obliczeniami naukowymi. Pliki z danymi, przykłady i materiały pomocnicze znajdziesz na stronie ftp://ftp.helion.pl/przyklady/XXX.zip.
- Przeprowadzaj eksploracje danych za pomocą powłoki IPython i środowiska Jupyter.
- Poznaj podstawowe i zaawansowane funkcje pakietu NumPy.
- Zacznij korzystać z narzędzi analitycznych pakietu pandas.
- Korzystaj z uniwersalnych narzędzi przeznaczonych do ładowania, czyszczenia, przekształcania i łączenia zbiorów danych.
- Twórz czytelne wizualizacje danych za pomocą pakietu matplotlib.
- Używaj funkcji groupby pakietu pandas w celu dzielenia, grupowania i podsumowywania zbiorów danych.
- Analizuj i przetwarzaj dane regularnych i nieregularnych szeregów czasowych.
- Naucz się rozwiązywać prawdziwe problemy analityczne na podstawie szczegółowo opisanych przykładów.
Wes McKinney jest twórcą pakietu pandas - popularnej otwartej biblioteki Pythona przeznaczonej do analizy danych. Wes często występuje w roli prelegenta na różnych konferencjach. Jest on twórcą otwartego oprogramowania. Zajmuje się językami Python i C++. Jest związany ze środowiskiem analityków pracujących w Pythonie i fundacją Apache Software Foundation. Obecnie pracuje w Nowym Jorku jako architekt oprogramowania.
Nowe wydanie książki, która w środowisku analityków pracujących w Pythonie jest uznawana za klasyka, zostało zaktualizowane tak, aby wykorzystać możliwości oferowane przez Pythona 3.6 i najnowsze funkcje pakietu pandas. Autor opisując poszczególne narzędzia analityczne wyjaśnia ich działanie i przedstawia sytuacje, w których można z nich korzystać w sposób efektywny i kreatywny. Niniejsza książka powinna znaleźć się w bibliotece każdej osoby zajmującej się przetwarzaniem danych.
Fernando Perez, Docent statystyki Uniwersytetu Kalifornijskiego w Berkeley, twórca środowiska IPython i współtwórca projektu Jupyter
Wybrane bestsellery
-
Oto uzupełnione i zaktualizowane wydanie bestsellerowego przewodnika dla inżynierów sieci. Dzięki niemu przejdziesz trudną (ale ekscytującą!) drogę od tradycyjnej platformy do platformy sieciowej opartej na najlepszych praktykach programistycznych. Zaczniesz od zagadnień podstawowych, aby następn...
Zaawansowana inżynieria sieci w Pythonie. Automatyzacja, monitorowanie i zarządzanie chmurą. Wydanie IV Zaawansowana inżynieria sieci w Pythonie. Automatyzacja, monitorowanie i zarządzanie chmurą. Wydanie IV
(83.85 zł najniższa cena z 30 dni)77.40 zł
129.00 zł(-40%) -
Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywisteg...
Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
(70.85 zł najniższa cena z 30 dni)65.40 zł
109.00 zł(-40%) -
Zanurz się w fascynujący świat programowania w języku Python i osiągnij imponujący poziom umiejętności w zaledwie 24 godziny! Oto kilka zalet, które sprawiają, że ta książka jest niezbędna dla każdego aspirującego programisty: Szybki start: podstawy Pythona już w pierwszych godzinach nauki ...
Python w 1 dzień. Nauka programowania w Pythonie w 24 godziny od A do Z Python w 1 dzień. Nauka programowania w Pythonie w 24 godziny od A do Z
-
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...
Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie
(50.05 zł najniższa cena z 30 dni)46.20 zł
77.00 zł(-40%) -
To trzecie, zaktualizowane i uzupełnione wydanie bestsellerowego podręcznika programowania w Pythonie. Naukę rozpoczniesz od podstawowych koncepcji programowania. Poznasz takie pojęcia jak zmienne, listy, klasy i pętle, a następnie utrwalisz je dzięki praktycznym ćwiczeniom. Dowiesz się, jak zape...(77.35 zł najniższa cena z 30 dni)
71.40 zł
119.00 zł(-40%) -
Agile i Scrum, Scrum i Agile. Opanowawszy branżę IT, powoli, ale konsekwentnie, zdobywają inne biznesowe przyczółki i rozgaszczają się w firmach na dobre… Albo niedobre, gdy budzą niezrozumienie, protesty, a czasem nawet chęć ucieczki! Agile i Scrum brzmią tak nowocześnie, w teorii świetnie...(25.93 zł najniższa cena z 30 dni)
23.94 zł
39.90 zł(-40%) -
Grunge. Brudny, chropawy rock and roll, wyrosły z miłości do punka i heavy metalu. Długie włosy, wojskowe buty i flanelowe koszule miały być symbolami buntu pokolenia, które w gazetach, telewizjach i stacjach radiowych uparcie nazywano straconym pokoleniem X. Szczycił się swoją odmiennością i sar...(39.96 zł najniższa cena z 30 dni)
34.90 zł
51.90 zł(-33%) -
W 1929 roku siedemnastoletnia Lenora Hope została oskarżona o brutalne zamordowanie swoich rodziców i siostry. Policja jednak nigdy nie udowodniła jej winy.(16.36 zł najniższa cena z 30 dni)
11.90 zł
40.90 zł(-71%) -
Zimą 1978 roku świat był bliski końca. Śnieg przykrył ziemię grubą warstwą, a niektórzy twierdzili, że nawet piekło zamarzło. Tymczasem ono właśnie wtedy się obudziło.(24.95 zł najniższa cena z 30 dni)
19.90 zł
49.90 zł(-60%) -
Zanurz się w świat spisku i zdrady, starych wrogów i nowych przyjaciół, zasypanej śniegiem dziczy i korporacyjnej chciwości.(30.79 zł najniższa cena z 30 dni)
24.90 zł
39.99 zł(-38%)
O autorze ebooka
Wes McKinney ― twórca oprogramowania open source, autor projektu pandas i współtwórca Apache Arrow. Członek The Apache Software Foundation, a także PMC Apache Parquet. Obecnie pełni funkcję dyrektora technicznego Voltron Data, gdzie zajmuje się przyspieszonymi technologiami obliczeniowymi opartymi na Apache Arrow.
Wes McKinney - pozostałe książki
-
Ta książka jest trzecim, starannie zaktualizowanym wydaniem wyczerpującego przewodnika po narzędziach analitycznych Pythona. Uwzględnia Pythona 3.0 i bibliotekę pandas 1.4. Została napisana w przystępny sposób, a poszczególne zagadnienia bogato zilustrowano przykładami, studiami rzeczywistych prz...
Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III
(77.35 zł najniższa cena z 30 dni)71.40 zł
119.00 zł(-40%) -
Get the definitive handbook for manipulating, processing, cleaning, and crunching datasets in Python. Updated for Python 3.10 and pandas 1.4, the third edition of this hands-on guide is packed with practical case studies that show you how to solve a broad set of data analysis problems effectively...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
Whether you’re a developer or a data scientist, working with large amounts of data can be a challenge. This book focuses on describing Apache Arrow’s format and data types and the benefits of using it to accelerate data manipulation. You’ll get to grips with topics such as Sp...
In-Memory Analytics with Apache Arrow. Perform fast and efficient data analytics on both flat and hierarchical structured data In-Memory Analytics with Apache Arrow. Perform fast and efficient data analytics on both flat and hierarchical structured data
Zobacz pozostałe książki z serii O'Reilly
-
To drugie, zaktualizowane wydanie przewodnika po systemie Prometheus. Znajdziesz w nim wyczerpujące wprowadzenie do tego oprogramowania, a także wskazówki dotyczące monitorowania aplikacji i infrastruktury, tworzenia wykresów, przekazywania ostrzeżeń, bezpośredniej instrumentacji kodu i pobierani...
Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II
(57.85 zł najniższa cena z 30 dni)53.40 zł
89.00 zł(-40%) -
Dzięki tej książce zrozumiesz bazowe koncepcje programowania funkcyjnego i przekonasz się, że możesz włączać je do kodu bez rezygnacji z paradygmatu obiektowego. Dowiesz się również, kiedy w swojej codziennej pracy i dlaczego używać takich opcjifunkcjonalności, jak niemutowalność i funkcje czyste...
Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego
(56.55 zł najniższa cena z 30 dni)52.20 zł
87.00 zł(-40%) -
To gruntownie zaktualizowane i uzupełnione wydanie praktycznego przewodnika po wdrażaniu i testowaniu kontenerów Dockera. Przedstawia proces przygotowania pakietu aplikacji ze wszystkimi ich zależnościami, a także jego testowania, wdrażania, skalowania i utrzymywania w środowiskach produkcyjnych....
Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III
(56.55 zł najniższa cena z 30 dni)52.20 zł
87.00 zł(-40%) -
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięk...
Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II
(83.85 zł najniższa cena z 30 dni)77.40 zł
129.00 zł(-40%) -
Oto kolejne wydanie zwięzłego podręcznika dla programistów Javy, który ma ułatwić maksymalne wykorzystanie technologii tego języka w wersji 17. Treść została skrupulatnie przejrzana i uzupełniona o materiał dotyczący nowości w obiektowym modelu Javy. Pierwsza część książki obejmuje wprowadzenie d...(57.85 zł najniższa cena z 30 dni)
53.40 zł
89.00 zł(-40%) -
Oto zwięzły i praktyczny przewodnik po usłudze GA4 i jej integracji z chmurą. Szczególnie skorzystają z niego analitycy danych, biznesu i marketingu. Opisano tu wszystkie istotne kwestie dotyczące tego nowego, potężnego modelu analitycznego. Szczególną uwagę poświęcono bardziej zaawansowanym funk...
Google Analytics od podstaw. Analiza wpływu biznesowego i wyznaczanie trendów Google Analytics od podstaw. Analiza wpływu biznesowego i wyznaczanie trendów
(44.85 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Dzięki tej książce dowiesz się, w jaki sposób uczynić architekturę oprogramowania wystarczająco plastyczną, aby mogła odzwierciedlać zachodzące zmiany biznesowe i technologiczne. W nowym wydaniu rozbudowano pojęcia zmiany kierowanej i przyrostowej, a także przedstawiono najnowsze techniki dotyczą...
Architektura ewolucyjna. Projektowanie oprogramowania i wsparcie zmian. Wydanie II Architektura ewolucyjna. Projektowanie oprogramowania i wsparcie zmian. Wydanie II
(43.55 zł najniższa cena z 30 dni)40.20 zł
67.00 zł(-40%) -
Właśnie w tym celu powstał ten przewodnik po filozofii oprogramowania. Znajdziesz w nim 21 pragmatycznych reguł, którymi kierują się najlepsi programiści. Dzięki spostrzeżeniom zawartym w książce zmienisz podejście do programowania i szybko się przekonasz, że pozwoli Ci to na pisanie lepszego, cz...(51.35 zł najniższa cena z 30 dni)
47.40 zł
79.00 zł(-40%) -
Ta książka, napisana z myślą o inżynierach oprogramowania, jest trzecim, gruntownie zaktualizowanym wydaniem praktycznego przewodnika, który szybko przeprowadzi Cię od podstaw aż do zaawansowanych technik pracy z Gitem. Po zapoznaniu się z filozofią systemu i jego najważniejszymi funkcjami płynni...
Kontrola wersji z systemem Git. Zaawansowane narzędzia i techniki do wspólnego projektowania oprogramowania. Wydanie III Kontrola wersji z systemem Git. Zaawansowane narzędzia i techniki do wspólnego projektowania oprogramowania. Wydanie III
(77.35 zł najniższa cena z 30 dni)71.40 zł
119.00 zł(-40%) -
Książka jest adresowana do wszystkich, którzy chcą budować, rozwijać i skalować systemy NLP w środowisku biznesowym, a także dostosowywać je do swojej branży. Opisuje tworzenie rzeczywistych aplikacji NLP. Omawia pełny cykl życia typowego projektu NLP, od zbierania danych po wdrożenie i monitorow...
Przetwarzanie języka naturalnego w praktyce. Przewodnik po budowie rzeczywistych systemów NLP Przetwarzanie języka naturalnego w praktyce. Przewodnik po budowie rzeczywistych systemów NLP
Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana
(70.85 zł najniższa cena z 30 dni)65.40 zł
109.00 zł(-40%)
Ebooka "Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd Edition
- Tłumaczenie:
- Konrad Matuk
- ISBN Książki drukowanej:
- 978-83-283-4081-7, 9788328340817
- Data wydania książki drukowanej:
- 2018-06-15
- ISBN Ebooka:
- 978-83-283-4082-4, 9788328340824
- Data wydania ebooka:
- 2018-06-15 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 168x237
- Numer z katalogu:
- 72180
- Rozmiar pliku Pdf:
- 4.7MB
- Rozmiar pliku ePub:
- 6.0MB
- Rozmiar pliku Mobi:
- 13.4MB
- Pobierz przykładowy rozdział PDF
- Przykłady na ftp
Ebook zawiera materiały dodatkowe, które możesz pobrać z serwera FTP - link znajdziesz na stronie redakcyjnej.
- Erraty / Zgłoś erratę
- Serie wydawnicze: O'Reilly
Spis treści ebooka
- 1.1. O czym jest ta książka? (15)
- Jakie rodzaje danych? (15)
- 1.2. Dlaczego warto korzystać z Pythona w celu przeprowadzenia analizy danych? (16)
- Python jako spoiwo (16)
- Rozwiązywanie problemu "dwujęzyczności" (17)
- Dlaczego nie Python? (17)
- 1.3. Podstawowe biblioteki Pythona (17)
- NumPy (18)
- pandas (18)
- Matplotlib (19)
- IPython i Jupyter (19)
- SciPy (20)
- Scikit-learn (21)
- statsmodels (21)
- 1.4. Instalacja i konfiguracja (22)
- Windows (22)
- Apple (OS X, macOS) (23)
- GNU, Linux (23)
- Instalowanie i aktualizowanie pakietów Pythona (24)
- Python 2 i Python 3 (24)
- Zintegrowane środowiska programistyczne i edytory tekstowe (25)
- 1.5. Społeczność i konferencje (25)
- 1.6. Nawigacja po książce (26)
- Przykłady kodu (27)
- Przykładowe dane (27)
- Konwencje importowania (27)
- Żargon (27)
- 2.1. Interpreter Pythona (30)
- 2.2. Podstawy interpretera IPython (31)
- Uruchamianie powłoki IPython (31)
- Uruchamianie notatnika Jupyter Notebook (32)
- Uzupełnianie poleceń (35)
- Introspekcja (36)
- Polecenie %run (37)
- Wykonywanie kodu ze schowka (39)
- Skróty klawiaturowe działające w terminalu (39)
- Polecenia magiczne (40)
- Integracja pakietu matplotlib (42)
- 2.3. Podstawy Pythona (42)
- Semantyka języka Python (43)
- Skalarne typy danych (50)
- Przepływ sterowania (57)
- 3.1. Struktury danych i sekwencje (61)
- Krotka (61)
- Lista (64)
- Wbudowane funkcje obsługujące sekwencje (68)
- Słownik (70)
- Zbiór (73)
- Lista, słownik i zbiór - składanie (75)
- 3.2. Funkcje (77)
- Przestrzenie nazw, zakres i funkcje lokalne (78)
- Zwracanie wielu wartości (79)
- Funkcje są obiektami (79)
- Funkcje anonimowe (lambda) (81)
- Currying - częściowa aplikacja argumentów (82)
- Generatory (82)
- Błędy i obsługa wyjątków (84)
- 3.3. Pliki i system operacyjny (86)
- Bajty i kodowanie Unicode w plikach (89)
- 3.4. Podsumowanie (91)
- 4.1. NumPy ndarray - wielowymiarowy obiekt tablicowy (95)
- Tworzenie tablic ndarray (96)
- Typ danych tablic ndarray (98)
- Działania matematyczne z tablicami NumPy (100)
- Podstawy indeksowania i przechwytywania części (101)
- Indeksowanie i wartości logiczne (105)
- Indeksowanie specjalne (108)
- Transponowanie tablic i zamiana osi (109)
- 4.2. Funkcje uniwersalne - szybkie funkcje wykonywane na poszczególnych elementach tablicy (110)
- 4.3. Programowanie z użyciem tablic (113)
- Logiczne operacje warunkowe jako operacje tablicowe (115)
- Metody matematyczne i statystyczne (116)
- Metody tablic logicznych (117)
- Sortowanie (118)
- Wartości unikalne i operacje logiczne (119)
- 4.4. Tablice i operacje na plikach (120)
- 4.5. Algebra liniowa (120)
- 4.6. Generowanie liczb pseudolosowych (122)
- 4.7. Przykład: błądzenie losowe (124)
- Jednoczesne symulowanie wielu błądzeń losowych (125)
- 4.8. Podsumowanie (126)
- 5.1. Wprowadzenie do struktur danych biblioteki pandas (127)
- Obiekt Series (128)
- Obiekt DataFrame (131)
- Obiekty index (137)
- 5.2. Podstawowe funkcjonalności (139)
- Uaktualnianie indeksu (139)
- Odrzucanie elementów osi (141)
- Indeksowanie, wybieranie i filtrowanie (143)
- Indeksy w postaci liczb całkowitych (147)
- Działania arytmetyczne i wyrównywanie danych (148)
- Funkcje apply i map (153)
- Sortowanie i tworzenie rankingów (154)
- Indeksy osi ze zduplikowanymi etykietami (157)
- 5.3. Podsumowywanie i generowanie statystyk opisowych (158)
- Współczynnik korelacji i kowariancja (161)
- Unikalne wartości, ich liczba i przynależność (163)
- 5.4. Podsumowanie (165)
- 6.1. Odczyt i zapis danych w formacie tekstowym (167)
- Wczytywanie części pliku tekstowego (173)
- Zapis danych w formacie tekstowym (174)
- Praca z plikami danych rozgraniczonych (176)
- Dane w formacie JSON (178)
- XML i HTML - web scraping (179)
- 6.2. Formaty danych binarnych (182)
- Obsługa formatu HDF5 (183)
- Wczytywanie plików programu Microsoft Excel (185)
- 6.3. Obsługa interfejsów sieciowych (186)
- 6.4. Obsługa baz danych (187)
- 6.5. Podsumowanie (188)
- 7.1. Obsługa brakujących danych (189)
- Filtrowanie brakujących danych (191)
- Wypełnianie brakujących danych (193)
- 7.2. Przekształcanie danych (195)
- Usuwanie duplikatów (195)
- Przekształcanie danych przy użyciu funkcji lub mapowania (196)
- Zastępowanie wartości (197)
- Zmiana nazw indeksów osi (199)
- Dyskretyzacja i podział na koszyki (200)
- Wykrywanie i filtrowanie elementów odstających (202)
- Permutacje i próbkowanie losowe (203)
- Przetwarzanie wskaźników i zmiennych zastępczych (204)
- 7.3. Operacje przeprowadzane na łańcuchach (207)
- Metody obiektu typu string (207)
- Wyrażenia regularne (209)
- Wektoryzacja funkcji łańcuchów w pakiecie pandas (212)
- 7.4. Podsumowanie (215)
- 8.1. Indeksowanie hierarchiczne (217)
- Zmiana kolejności i sortowanie poziomów (220)
- Parametry statystyki opisowej z uwzględnieniem poziomu (220)
- Indeksowanie z kolumnami ramki danych (221)
- 8.2. Łączenie zbiorów danych (222)
- Łączenie ramek danych w stylu łączenia elementów baz danych (222)
- Łączenie przy użyciu indeksu (227)
- Konkatenacja wzdłuż osi (230)
- Łączenie częściowo nakładających się danych (234)
- 8.3. Zmiana kształtu i operacje osiowe (235)
- Przekształcenia z indeksowaniem hierarchicznym (236)
- Przekształcanie z formatu "długiego" na "szeroki" (238)
- Przekształcanie z formatu "szerokiego" na "długi" (241)
- 8.4. Podsumowanie (243)
- 9.1. Podstawy obsługi interfejsu pakietu matplotlib (245)
- Obiekty figure i wykresy składowe (246)
- Kolory, oznaczenia i style linii (250)
- Punkty, etykiety i legendy (252)
- Adnotacje i rysunki (255)
- Zapisywanie wykresów w postaci plików (257)
- Konfiguracja pakietu matplotlib (258)
- 9.2. Generowanie wykresów za pomocą pakietów pandas i seaborn (259)
- Wykresy liniowe (259)
- Wykresy słupkowe (262)
- Histogramy i wykresy gęstości (266)
- Wykresy punktowe (268)
- Wykresy panelowe i dane kategoryczne (269)
- 9.3. Inne narzędzia przeznaczone do wizualizacji danych w Pythonie (272)
- 9.4. Podsumowanie (272)
- 10.1. Mechanika interfejsu groupby (274)
- Iteracja po grupach (277)
- Wybieranie kolumny lub podzbioru kolumn (278)
- Grupowanie przy użyciu słowników i serii (279)
- Grupowanie przy użyciu funkcji (280)
- Grupowanie przy użyciu poziomów indeksu (280)
- 10.2. Agregacja danych (281)
- Przetwarzanie kolumna po kolumnie i stosowanie wielu funkcji (282)
- Zwracanie zagregowanych danych bez indeksów wierszy (285)
- 10.3. Metoda apply - ogólne zastosowanie techniki dziel-zastosuj-połącz (286)
- Usuwanie kluczy grup (288)
- Kwantyle i analiza koszykowa (288)
- Przykład: wypełnianie brakujących wartości przy użyciu wartości charakterystycznych dla grupy (290)
- Przykład: losowe generowanie próbek i permutacja (292)
- Przykład: średnie ważone grup i współczynnik korelacji (293)
- Przykład: regresja liniowa grup (295)
- 10.4. Tabele przestawne i krzyżowe (295)
- Tabele krzyżowe (298)
- 10.5. Podsumowanie (299)
- 11.1. Typy danych i narzędzia przeznaczone do obsługi daty i czasu (302)
- Konwersja pomiędzy obiektami string i datetime (303)
- 11.2. Podstawy szeregów czasowych (305)
- Indeksowanie i wybieranie (306)
- Szeregi czasowe z duplikatami indeksów (309)
- 11.3. Zakresy dat, częstotliwości i przesunięcia (310)
- Generowanie zakresów dat (310)
- Częstotliwości i przesunięcia daty (313)
- Przesuwanie daty (314)
- 11.4. Obsługa strefy czasowej (317)
- Lokalizacja i konwersja stref czasowych (317)
- Operacje z udziałem obiektów Timestamp o wyznaczonej strefie czasowej (319)
- Operacje pomiędzy różnymi strefami czasowymi (320)
- 11.5. Okresy i przeprowadzanie na nich operacji matematycznych (321)
- Konwersja częstotliwości łańcuchów (322)
- Kwartalne częstotliwości okresów (323)
- Konwersja znaczników czasu na okresy (i z powrotem) (325)
- Tworzenie obiektów PeriodIndex na podstawie tablic (326)
- 11.6. Zmiana rozdzielczości i konwersja częstotliwości (328)
- Zmniejszanie częstotliwości (329)
- Zwiększanie rozdzielczości i interpolacja (332)
- Zmiana rozdzielczości z okresami (333)
- 11.7. Funkcje ruchomego okna (334)
- Funkcje ważone wykładniczo (337)
- Binarne funkcje ruchomego okna (338)
- Funkcje ruchomego okna definiowane przez użytkownika (340)
- 11.8. Podsumowanie (340)
- 12.1. Dane kategoryczne (341)
- Kontekst i motywacja (341)
- Typ Categorical w bibliotece pandas (343)
- Obliczenia na obiektach typu Categorical (345)
- Metody obiektu kategorycznego (347)
- 12.2. Zaawansowane operacje grupowania (349)
- Transformacje grup i "nieobudowane" operacje grupowania (349)
- Zmiana rozdzielczości czasu przeprowadzana przy użyciu grup (353)
- 12.3. Techniki łączenia metod w łańcuch (354)
- Metoda pipe (355)
- 12.4. Podsumowanie (356)
- 13.1. Łączenie pandas z kodem modelu (357)
- 13.2. Tworzenie opisów modeli przy użyciu biblioteki Patsy (360)
- Przekształcenia danych za pomocą formuł Patsy (362)
- Patsy i dane kategoryczne (363)
- 13.3. Wprowadzenie do biblioteki statsmodels (366)
- Szacowanie modeli liniowych (366)
- Szacowanie procesów szeregów czasowych (369)
- 13.4. Wprowadzenie do pakietu scikit-learn (369)
- 13.5. Dalszy rozwój (373)
- 14.1. Dane USA.gov serwisu Bitly (375)
- Liczenie stref czasowych w czystym Pythonie (376)
- Liczenie stref czasowych przy użyciu pakietu pandas (378)
- 14.2. Zbiór danych MovieLens 1M (384)
- Wyznaczenie rozbieżności ocen (388)
- 14.3. Imiona nadawane dzieciom w USA w latach 1880 - 2010 (389)
- Analiza trendów imion (394)
- 14.4. Baza danych USDA Food (402)
- 14.5. Baza danych 2012 Federal Election Commission (406)
- Statystyki datków z podziałem na wykonywany zawód i pracodawcę (409)
- Podział kwot datków na koszyki (411)
- Statystyki datków z podziałem na poszczególne stany (413)
- 14.6. Podsumowanie (414)
- A.1. Szczegóły budowy obiektu ndarray (415)
- Hierarchia typów danych NumPy (416)
- A.2. Zaawansowane operacje tablicowe (417)
- Zmiana wymiarów tablic (417)
- Kolejności charakterystyczne dla języków C i Fortran (419)
- Łączenie i dzielenie tablic (420)
- Powtarzanie elementów - funkcje tile i repeat (422)
- Alternatywy indeksowania specjalnego - metody take i put (423)
- A.3. Rozgłaszanie (424)
- Rozgłaszanie wzdłuż innych osi (426)
- Przypisywanie wartości elementom tablicy poprzez rozgłaszanie (428)
- A.4. Zaawansowane zastosowania funkcji uniwersalnych (429)
- Metody instancji funkcji uniwersalnych (429)
- Pisanie nowych funkcji uniwersalnych w Pythonie (431)
- A.5. Tablice o złożonej strukturze (432)
- Zagnieżdżone typy danych i pola wielowymiarowe (433)
- Do czego przydają się tablice o złożonej strukturze? (434)
- A.6. Jeszcze coś o sortowaniu (434)
- Sortowanie pośrednie - metody argsort i lexsort (435)
- Alternatywne algorytmy sortowania (436)
- Częściowe sortowanie tablic (437)
- Wyszukiwanie elementów w posortowanej tablicy za pomocą metody numpy.searchsorted (438)
- A.7. Pisanie szybkich funkcji NumPy za pomocą pakietu Numba (439)
- Tworzenie obiektów numpy.ufunc za pomocą pakietu Numba (440)
- A.8. Zaawansowane tablicowe operacje wejścia i wyjścia (441)
- Pliki mapowane w pamięci (441)
- HDF5 i inne możliwości zapisu tablic (442)
- A.9. Jak zachować wysoką wydajność? (442)
- Dlaczego warto korzystać z sąsiadujących ze sobą obszarów pamięci? (443)
- B.1. Korzystanie z historii poleceń (445)
- Przeszukiwanie i korzystanie z historii poleceń (445)
- Zmienne wejściowe i wyjściowe (446)
- B.2. Interakcja z systemem operacyjnym (447)
- Polecenia powłoki systemowej i aliasy (447)
- System tworzenia skrótów do katalogów (448)
- B.3. Narzędzia programistyczne (449)
- Interaktywny debuger (449)
- Pomiar czasu - funkcje %time i %timeit (453)
- Podstawowe profilowanie - funkcje %prun i %run-p (455)
- Profilowanie funkcji linia po linii (457)
- B.4. Wskazówki dotyczące produktywnego tworzenia kodu w środowisku IPython (458)
- Przeładowywanie modułów (459)
- Wskazówki dotyczące projektowania kodu (460)
- B.5. Zaawansowane funkcje środowiska IPython (461)
- Co zrobić, aby własne klasy były przyjazne dla systemu IPython? (461)
- Profile i konfiguracja (462)
Przedmowa (11)
1. Wstęp (15)
2. Podstawy Pythona oraz obsługi narzędzi IPython i Jupyter (29)
3. Wbudowane struktury danych, funkcje i pliki (61)
4. Podstawy biblioteki NumPy: obsługa tablic i wektorów (93)
5. Rozpoczynamy pracę z biblioteką pandas (127)
6. Odczyt i zapis danych, formaty plików (167)
7. Czyszczenie i przygotowywanie danych (189)
8. Przetwarzanie danych - operacje łączenia, wiązania i przekształcania (217)
9. Wykresy i wizualizacja danych (245)
10. Agregacja danych i operacje wykonywane na grupach (273)
11. Szeregi czasowe (301)
12. Zaawansowane funkcje biblioteki pandas (341)
13. Wprowadzenie do bibliotek modelujących (357)
14. Przykłady analizy danych (375)
A. Zaawansowane zagadnienia związane z biblioteką NumPy (415)
B. Dodatkowe informacje dotyczące systemu IPython (445)
Skorowidz (465)
Helion - inne książki
-
Jesteś specjalistą IT. I jesteś dobry w tym, co robisz. Masz wiedzę, doświadczenie, chcesz się nimi podzielić z innymi, pomóc im radzić sobie z problemami, które sam już dawno rozwiązałeś, może także zaprezentować się od tej strony przyszłym pracodawcom i zleceniodawcom, tylko... kto - poza Tobą ...
Marka osobista w branży IT. Jak ją zbudować i rozwijać Marka osobista w branży IT. Jak ją zbudować i rozwijać
(32.44 zł najniższa cena z 30 dni)29.94 zł
49.90 zł(-40%) -
MikroTik, łotewska firma z siedzibą w Rydze, od lat produkuje sprzęt sieciowy. Przystępna cena i świetna jakość sprawiły, że urządzenia sygnowane logo MikroTik zdobyły niezwykłą popularność - po produkty łotewskiej marki sięga się coraz częściej. Jeśli planujesz zmodernizować lub zbudować sieć i ...
Konfiguracja usług sieciowych na urządzeniach MikroTik Konfiguracja usług sieciowych na urządzeniach MikroTik
(51.35 zł najniższa cena z 30 dni)47.40 zł
79.00 zł(-40%) -
Tę książkę docenią wszyscy zainteresowani eksploracją danych i uczeniem maszynowym, którzy chcieliby pewnie poruszać się w świecie nauki o danych. Pokazano tu, w jaki sposób Excel pozwala zobrazować proces ich eksplorowania i jak działają poszczególne techniki w tym zakresie. Przejrzyście wyjaśni...
Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku
(43.55 zł najniższa cena z 30 dni)40.20 zł
67.00 zł(-40%) -
Ta książka będzie świetnym uzupełnieniem wiedzy o Flutterze i Darcie, sprawdzi się również jako wsparcie podczas rozwiązywania konkretnych problemów. Znalazło się tu ponad sto receptur, dzięki którym poznasz tajniki pisania efektywnego kodu, korzystania z narzędzi udostępnianych przez framework F...
Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack
(44.85 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Ten przewodnik, który docenią programiści i architekci, zawiera wyczerpujące omówienie zagadnień projektowania, funkcjonowania i modyfikowania architektury API. Od strony praktycznej przedstawia strategie budowania i testowania API REST umożliwiającego połączenie oferowanej funkcjonalności na poz...
Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API
(44.85 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
W tej książce opisano różne zastosowania GPT-4 w medycynie: jako źródło informacji medycznej, wsparcie w podejmowaniu decyzji dotyczących leczenia czy też pomoc w tworzeniu dokumentacji, takiej jak podsumowanie wizyty pacjenta. Podczas lektury odkryjesz niezwykły potencjał tej technologii, przeko...
Rewolucja sztucznej inteligencji w medycynie. Jak GPT-4 może zmienić przyszłość Rewolucja sztucznej inteligencji w medycynie. Jak GPT-4 może zmienić przyszłość
(43.55 zł najniższa cena z 30 dni)40.20 zł
67.00 zł(-40%) -
Oto zwięzłe i równocześnie praktyczne kompendium, w którym znajdziesz 20 praktyk udanego planowania, analizy, specyfikacji, walidacji i zarządzania wymaganiami. Praktyki te są odpowiednie dla projektów zarządzanych zarówno w tradycyjny, jak i zwinny sposób, niezależnie od branży. Sprawią, że zesp...
Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej
(43.55 zł najniższa cena z 30 dni)40.20 zł
67.00 zł(-40%) -
Zigi to postać fikcyjna - warta poznania! Autor książki, sam będący od wielu lat testerem, wyposażył swojego bohatera we własne doświadczenia. Dołożył do nich trochę „case’ów”, które widział, o których słyszał lub czytał, ubrał je w przystępne słowa i sfabularyzował dla podkręce...(38.35 zł najniższa cena z 30 dni)
35.40 zł
59.00 zł(-40%) -
W tej książce omówiono ponad 20 najprzydatniejszych wzorców projektowych, dzięki którym tworzone aplikacje internetowe będą łatwe w późniejszej obsłudze technicznej i w trakcie skalowania. Poza wzorcami projektowymi przedstawiono wzorce generowania i wydajności działania, których znaczenie dla uż...
Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II
(44.85 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Testowanie oprogramowania to jedna z najdynamiczniej rozwijających się dziedzin inżynierii oprogramowania. Zarobki doświadczonych testerów są porównywalne z wynagrodzeniem, jakie otrzymują dobrzy programiści. Aby rozpocząć karierę w tym zawodzie, trzeba się legitymować odpowiednimi umiejętnościam...
Certyfikowany tester ISTQB®. Poziom podstawowy. Wydanie II Certyfikowany tester ISTQB®. Poziom podstawowy. Wydanie II
(70.85 zł najniższa cena z 30 dni)65.40 zł
109.00 zł(-40%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II Wes McKinney (4) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.
(3)
(1)
(0)
(0)
(0)
(0)
Oceny i opinie poprzedniego wydania
więcej opinii