Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II
- Autor: :
- Wes McKinney
- Wydawnictwo:
- Helion
- Wydawnictwo:
- Helion
- Ocena:
- 5.8/6 Opinie: 4
- Stron:
- 480
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Sprawdź nowe wydanie
Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III
Wes McKinney
Opis ebooka: Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II
Analiza danych stała się samodzielną dyscypliną wiedzy interesującą specjalistów z wielu branż: analityków biznesowych, statystyków, architektów oprogramowania czy też osoby zajmujące się sztuczną inteligencją. Wydobywanie informacji ze zbiorów danych pozwala na uzyskanie wiedzy niedostępnej w inny sposób. W tym celu dane trzeba odpowiednio przygotować, oczyścić, przetworzyć i oczywiście poddać analizie. Warto również zadbać o ich wizualizację. Do tych wszystkich zadań najlepiej wykorzystać specjalne narzędzia opracowane w języku Python.
Prezentowana książka jest drugim, zaktualizowanym i uzupełnionym, wydaniem klasycznego podręcznika napisanego z myślą o analitykach, którzy dotychczas nie pracowali w Pythonie, oraz o programistach Pythona, którzy nie zajmowali się dotąd analizą danych ani obliczeniami naukowymi. Przedstawiono tu możliwości oferowane przez Pythona 3.6 oraz najnowsze funkcje pakietów Pandas i NumPy, a także środowisk IPython i Jupyter. Przy opisie poszczególnych narzędzi analitycznych wyjaśniono ich działanie i zaprezentowano przykłady ich wykorzystania w sposób efektywny i kreatywny. Ta książka powinna się znaleźć w podręcznej bibliotece każdego analityka danych!
Najważniejsze zagadnienia:
- Eksploracja danych za pomocą powłoki IPython i środowiska Jupyter
- Korzystanie z pakietów NumPy i Pandas
- Tworzenie wizualizacji danych za pomocą pakietu Matplotlib
- Praca z danymi regularnych i nieregularnych szeregów czasowych
- Rozwiązywanie rzeczywistych problemów analitycznych
Python: poznaj idealne narzędzie do analizy danych!
Python w analizie danych
Naucz się przetwarzać, czyścić i analizować dane w Pythonie. Drugie wydanie tej książki zostało zaktualizowane pod kątem Pythona 3.6 i zawiera wiele praktycznych przykładów ilustrujących skuteczne sposoby rozwiązywania różnych problemów związanych z analizą danych. Dzięki lekturze tej książki nauczysz się korzystać ze wszystkich możliwości oferowanych przez najnowsze wersje pakietów pandas i NumPy, a także środowisk IPython i Jupyter.
Autorem tej książki jest Wes McKinney - twórca projektu pandas. Pozycja ta stanowi praktyczne i nowoczesne wprowadzenie do narzędzi analitycznych Pythona, Książka ta została napisana z myślą o analitykach, którzy nie pracowali dotychczas w Pythonie, a także programistach Pythona, którzy nie zajmowali się dotychczas analizą danych i obliczeniami naukowymi. Pliki z danymi, przykłady i materiały pomocnicze znajdziesz na stronie ftp://ftp.helion.pl/przyklady/XXX.zip.
- Przeprowadzaj eksploracje danych za pomocą powłoki IPython i środowiska Jupyter.
- Poznaj podstawowe i zaawansowane funkcje pakietu NumPy.
- Zacznij korzystać z narzędzi analitycznych pakietu pandas.
- Korzystaj z uniwersalnych narzędzi przeznaczonych do ładowania, czyszczenia, przekształcania i łączenia zbiorów danych.
- Twórz czytelne wizualizacje danych za pomocą pakietu matplotlib.
- Używaj funkcji groupby pakietu pandas w celu dzielenia, grupowania i podsumowywania zbiorów danych.
- Analizuj i przetwarzaj dane regularnych i nieregularnych szeregów czasowych.
- Naucz się rozwiązywać prawdziwe problemy analityczne na podstawie szczegółowo opisanych przykładów.
Wes McKinney jest twórcą pakietu pandas - popularnej otwartej biblioteki Pythona przeznaczonej do analizy danych. Wes często występuje w roli prelegenta na różnych konferencjach. Jest on twórcą otwartego oprogramowania. Zajmuje się językami Python i C++. Jest związany ze środowiskiem analityków pracujących w Pythonie i fundacją Apache Software Foundation. Obecnie pracuje w Nowym Jorku jako architekt oprogramowania.
Nowe wydanie książki, która w środowisku analityków pracujących w Pythonie jest uznawana za klasyka, zostało zaktualizowane tak, aby wykorzystać możliwości oferowane przez Pythona 3.6 i najnowsze funkcje pakietu pandas. Autor opisując poszczególne narzędzia analityczne wyjaśnia ich działanie i przedstawia sytuacje, w których można z nich korzystać w sposób efektywny i kreatywny. Niniejsza książka powinna znaleźć się w bibliotece każdej osoby zajmującej się przetwarzaniem danych.
Fernando Perez, Docent statystyki Uniwersytetu Kalifornijskiego w Berkeley, twórca środowiska IPython i współtwórca projektu Jupyter
Wybrane bestsellery
-
Język programowania ogólnego przeznaczenia Python należy obecnie do najpopularniejszych na świecie. Skąd się bierze jego fenomen? Niewątpliwie kluczowe znaczenie ma tu bardzo czytelna składnia, mocno zbliżona do składni języka naturalnego. Czyni to Pythona dość łatwym do opanowania, także dla poc...(47.20 zł najniższa cena z 30 dni)
41.30 zł
59.00 zł(-30%) -
Tę książkę docenią średnio zaawansowani użytkownicy Pythona, którzy tworzą aplikacje korzystające z osiągnięć nauki o danych. Znajdziesz w niej omówienie możliwości języka, wbudowanych struktur danych Pythona, jak również takich bibliotek jak NumPy, pandas, scikit-learn i matplotlib. Nauczysz się...(44.85 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
Internet rozwija się w niesamowitym tempie. Dawniej sieć WWW była prostsza ― projektanci łączyli kod PHP, HTML i zapytania do MySQL w jednym pliku. Z czasem urosła do miliardów stron, co radykalnie zmieniło jej kształt. Zmieniły się też narzędzia i sposób pracy. Dziś idealnym wyborem dewelo...(44.85 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych...(41.40 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...(53.40 zł najniższa cena z 30 dni)
62.30 zł
89.00 zł(-30%) -
Agile i Scrum, Scrum i Agile. Opanowawszy branżę IT, powoli, ale konsekwentnie, zdobywają inne biznesowe przyczółki i rozgaszczają się w firmach na dobre… Albo niedobre, gdy budzą niezrozumienie, protesty, a czasem nawet chęć ucieczki! Agile i Scrum brzmią tak nowocześnie, w teorii świetnie...(23.94 zł najniższa cena z 30 dni)
27.93 zł
39.90 zł(-30%) -
To trzecie, zaktualizowane i uzupełnione wydanie bestsellerowego podręcznika programowania w Pythonie. Naukę rozpoczniesz od podstawowych koncepcji programowania. Poznasz takie pojęcia jak zmienne, listy, klasy i pętle, a następnie utrwalisz je dzięki praktycznym ćwiczeniom. Dowiesz się, jak zape...(71.40 zł najniższa cena z 30 dni)
83.30 zł
119.00 zł(-30%) -
W 1929 roku siedemnastoletnia Lenora Hope została oskarżona o brutalne zamordowanie swoich rodziców i siostry. Policja jednak nigdy nie udowodniła jej winy.(20.45 zł najniższa cena z 30 dni)
32.72 zł
40.90 zł(-20%) -
Mam licencje na wszystko. Radio? Proszę bardzo. Gdy mam powiedzieć w porze największej słuchalności ogłaszając zabójcze wyniki wyborów: Drodzy Panstwo! KURWA MAC! nie ma problemu. Zorganizować koncert Perfectu w ścisłym centrum, zakorkować Warszawę o ósmej rano w poniedziałek i dogadać się z poli...(34.83 zł najniższa cena z 30 dni)
34.83 zł
51.99 zł(-33%) -
Nieszczęśliwi kochankowie, niechciane przeznaczenie. Fascynująca czwarta część serii "Królestwo Mostu". Keris, który niedawno został królem, musiał przyglądać się bezradnie, kiedy jego zakazany związek z Zarrah wyszedł na jaw. Ale kiedy Zarrah została uwięziona przez cesarzową, Keris wie, że istn...(49.12 zł najniższa cena z 30 dni)
49.33 zł
59.90 zł(-18%)
O autorze ebooka
Wes McKinney ― twórca oprogramowania open source, autor projektu pandas i współtwórca Apache Arrow. Członek The Apache Software Foundation, a także PMC Apache Parquet. Obecnie pełni funkcję dyrektora technicznego Voltron Data, gdzie zajmuje się przyspieszonymi technologiami obliczeniowymi opartymi na Apache Arrow.
Wes McKinney - pozostałe książki
-
Ta książka jest trzecim, starannie zaktualizowanym wydaniem wyczerpującego przewodnika po narzędziach analitycznych Pythona. Uwzględnia Pythona 3.0 i bibliotekę pandas 1.4. Została napisana w przystępny sposób, a poszczególne zagadnienia bogato zilustrowano przykładami, studiami rzeczywistych prz...(71.40 zł najniższa cena z 30 dni)
83.30 zł
119.00 zł(-30%) -
Get the definitive handbook for manipulating, processing, cleaning, and crunching datasets in Python. Updated for Python 3.10 and pandas 1.4, the third edition of this hands-on guide is packed with practical case studies that show you how to solve a broad set of data analysis problems effectively...(188.31 zł najniższa cena z 30 dni)
188.25 zł
249.00 zł(-24%) -
Whether you're a developer or a data scientist, working with large amounts of data can be a challenge. This book focuses on describing Apache Arrow's format and data types and the benefits of using it to accelerate data manipulation. You'll get to grips with topics such as Spark, Jupyter, Arrow F...(103.01 zł najniższa cena z 30 dni)
143.02 zł
149.00 zł(-4%)
Zobacz pozostałe książki z serii
-
To drugie, zaktualizowane wydanie przewodnika po systemie Prometheus. Znajdziesz w nim wyczerpujące wprowadzenie do tego oprogramowania, a także wskazówki dotyczące monitorowania aplikacji i infrastruktury, tworzenia wykresów, przekazywania ostrzeżeń, bezpośredniej instrumentacji kodu i pobierani...(53.40 zł najniższa cena z 30 dni)
62.30 zł
89.00 zł(-30%) -
Dzięki tej książce zrozumiesz bazowe koncepcje programowania funkcyjnego i przekonasz się, że możesz włączać je do kodu bez rezygnacji z paradygmatu obiektowego. Dowiesz się również, kiedy w swojej codziennej pracy używać takich opcji jak niemutowalność i funkcje czyste i dlaczego warto to robić....(52.20 zł najniższa cena z 30 dni)
60.90 zł
87.00 zł(-30%) -
Ta książka będzie świetnym uzupełnieniem wiedzy o Flutterze i Darcie, sprawdzi się również jako wsparcie podczas rozwiązywania konkretnych problemów. Znalazło się tu ponad sto receptur, dzięki którym poznasz tajniki pisania efektywnego kodu, korzystania z narzędzi udostępnianych przez framework F...(41.40 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
Ten przewodnik, który docenią programiści i architekci, zawiera wyczerpujące omówienie zagadnień projektowania, funkcjonowania i modyfikowania architektury API. Od strony praktycznej przedstawia strategie budowania i testowania API REST umożliwiającego połączenie oferowanej funkcjonalności na poz...(41.40 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
W tej książce omówiono ponad 20 najprzydatniejszych wzorców projektowych, dzięki którym tworzone aplikacje internetowe będą łatwe w późniejszej obsłudze technicznej i w trakcie skalowania. Poza wzorcami projektowymi przedstawiono wzorce generowania i wydajności działania, których znaczenie dla uż...(41.40 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
To gruntownie zaktualizowane i uzupełnione wydanie praktycznego przewodnika po wdrażaniu i testowaniu kontenerów Dockera. Przedstawia proces przygotowania pakietu aplikacji ze wszystkimi ich zależnościami, a także jego testowania, wdrażania, skalowania i utrzymywania w środowiskach produkcyjnych....(52.20 zł najniższa cena z 30 dni)
60.90 zł
87.00 zł(-30%) -
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...(46.20 zł najniższa cena z 30 dni)
53.90 zł
77.00 zł(-30%) -
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięk...(77.40 zł najniższa cena z 30 dni)
90.30 zł
129.00 zł(-30%) -
Oto kolejne wydanie zwięzłego podręcznika dla programistów Javy, który ma ułatwić maksymalne wykorzystanie technologii tego języka w wersji 17. Treść została skrupulatnie przejrzana i uzupełniona o materiał dotyczący nowości w obiektowym modelu Javy. Pierwsza część książki obejmuje wprowadzenie d...(53.40 zł najniższa cena z 30 dni)
62.30 zł
89.00 zł(-30%) -
Oto zwięzły i praktyczny przewodnik po usłudze GA4 i jej integracji z chmurą. Szczególnie skorzystają z niego analitycy danych, biznesu i marketingu. Opisano tu wszystkie istotne kwestie dotyczące tego nowego, potężnego modelu analitycznego. Szczególną uwagę poświęcono bardziej zaawansowanym funk...(41.40 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%)
Ebooka "Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, 2nd Edition
- Tłumaczenie:
- Konrad Matuk
- ISBN Książki drukowanej:
- 978-83-283-4081-7, 9788328340817
- Data wydania książki drukowanej:
- 2018-06-15
- ISBN Ebooka:
- 978-83-283-4082-4, 9788328340824
- Data wydania ebooka:
- 2018-06-15 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 168x237
- Numer z katalogu:
- 72180
- Rozmiar pliku Pdf:
- 4.7MB
- Rozmiar pliku ePub:
- 6.0MB
- Rozmiar pliku Mobi:
- 13.4MB
- Przykłady na ftp
Ebook zawiera materiały dodatkowe, które możesz pobrać z serwera FTP - link znajdziesz na stronie redakcyjnej.
Spis treści ebooka
- 1.1. O czym jest ta książka? (15)
- Jakie rodzaje danych? (15)
- 1.2. Dlaczego warto korzystać z Pythona w celu przeprowadzenia analizy danych? (16)
- Python jako spoiwo (16)
- Rozwiązywanie problemu "dwujęzyczności" (17)
- Dlaczego nie Python? (17)
- 1.3. Podstawowe biblioteki Pythona (17)
- NumPy (18)
- pandas (18)
- Matplotlib (19)
- IPython i Jupyter (19)
- SciPy (20)
- Scikit-learn (21)
- statsmodels (21)
- 1.4. Instalacja i konfiguracja (22)
- Windows (22)
- Apple (OS X, macOS) (23)
- GNU, Linux (23)
- Instalowanie i aktualizowanie pakietów Pythona (24)
- Python 2 i Python 3 (24)
- Zintegrowane środowiska programistyczne i edytory tekstowe (25)
- 1.5. Społeczność i konferencje (25)
- 1.6. Nawigacja po książce (26)
- Przykłady kodu (27)
- Przykładowe dane (27)
- Konwencje importowania (27)
- Żargon (27)
- 2.1. Interpreter Pythona (30)
- 2.2. Podstawy interpretera IPython (31)
- Uruchamianie powłoki IPython (31)
- Uruchamianie notatnika Jupyter Notebook (32)
- Uzupełnianie poleceń (35)
- Introspekcja (36)
- Polecenie %run (37)
- Wykonywanie kodu ze schowka (39)
- Skróty klawiaturowe działające w terminalu (39)
- Polecenia magiczne (40)
- Integracja pakietu matplotlib (42)
- 2.3. Podstawy Pythona (42)
- Semantyka języka Python (43)
- Skalarne typy danych (50)
- Przepływ sterowania (57)
- 3.1. Struktury danych i sekwencje (61)
- Krotka (61)
- Lista (64)
- Wbudowane funkcje obsługujące sekwencje (68)
- Słownik (70)
- Zbiór (73)
- Lista, słownik i zbiór - składanie (75)
- 3.2. Funkcje (77)
- Przestrzenie nazw, zakres i funkcje lokalne (78)
- Zwracanie wielu wartości (79)
- Funkcje są obiektami (79)
- Funkcje anonimowe (lambda) (81)
- Currying - częściowa aplikacja argumentów (82)
- Generatory (82)
- Błędy i obsługa wyjątków (84)
- 3.3. Pliki i system operacyjny (86)
- Bajty i kodowanie Unicode w plikach (89)
- 3.4. Podsumowanie (91)
- 4.1. NumPy ndarray - wielowymiarowy obiekt tablicowy (95)
- Tworzenie tablic ndarray (96)
- Typ danych tablic ndarray (98)
- Działania matematyczne z tablicami NumPy (100)
- Podstawy indeksowania i przechwytywania części (101)
- Indeksowanie i wartości logiczne (105)
- Indeksowanie specjalne (108)
- Transponowanie tablic i zamiana osi (109)
- 4.2. Funkcje uniwersalne - szybkie funkcje wykonywane na poszczególnych elementach tablicy (110)
- 4.3. Programowanie z użyciem tablic (113)
- Logiczne operacje warunkowe jako operacje tablicowe (115)
- Metody matematyczne i statystyczne (116)
- Metody tablic logicznych (117)
- Sortowanie (118)
- Wartości unikalne i operacje logiczne (119)
- 4.4. Tablice i operacje na plikach (120)
- 4.5. Algebra liniowa (120)
- 4.6. Generowanie liczb pseudolosowych (122)
- 4.7. Przykład: błądzenie losowe (124)
- Jednoczesne symulowanie wielu błądzeń losowych (125)
- 4.8. Podsumowanie (126)
- 5.1. Wprowadzenie do struktur danych biblioteki pandas (127)
- Obiekt Series (128)
- Obiekt DataFrame (131)
- Obiekty index (137)
- 5.2. Podstawowe funkcjonalności (139)
- Uaktualnianie indeksu (139)
- Odrzucanie elementów osi (141)
- Indeksowanie, wybieranie i filtrowanie (143)
- Indeksy w postaci liczb całkowitych (147)
- Działania arytmetyczne i wyrównywanie danych (148)
- Funkcje apply i map (153)
- Sortowanie i tworzenie rankingów (154)
- Indeksy osi ze zduplikowanymi etykietami (157)
- 5.3. Podsumowywanie i generowanie statystyk opisowych (158)
- Współczynnik korelacji i kowariancja (161)
- Unikalne wartości, ich liczba i przynależność (163)
- 5.4. Podsumowanie (165)
- 6.1. Odczyt i zapis danych w formacie tekstowym (167)
- Wczytywanie części pliku tekstowego (173)
- Zapis danych w formacie tekstowym (174)
- Praca z plikami danych rozgraniczonych (176)
- Dane w formacie JSON (178)
- XML i HTML - web scraping (179)
- 6.2. Formaty danych binarnych (182)
- Obsługa formatu HDF5 (183)
- Wczytywanie plików programu Microsoft Excel (185)
- 6.3. Obsługa interfejsów sieciowych (186)
- 6.4. Obsługa baz danych (187)
- 6.5. Podsumowanie (188)
- 7.1. Obsługa brakujących danych (189)
- Filtrowanie brakujących danych (191)
- Wypełnianie brakujących danych (193)
- 7.2. Przekształcanie danych (195)
- Usuwanie duplikatów (195)
- Przekształcanie danych przy użyciu funkcji lub mapowania (196)
- Zastępowanie wartości (197)
- Zmiana nazw indeksów osi (199)
- Dyskretyzacja i podział na koszyki (200)
- Wykrywanie i filtrowanie elementów odstających (202)
- Permutacje i próbkowanie losowe (203)
- Przetwarzanie wskaźników i zmiennych zastępczych (204)
- 7.3. Operacje przeprowadzane na łańcuchach (207)
- Metody obiektu typu string (207)
- Wyrażenia regularne (209)
- Wektoryzacja funkcji łańcuchów w pakiecie pandas (212)
- 7.4. Podsumowanie (215)
- 8.1. Indeksowanie hierarchiczne (217)
- Zmiana kolejności i sortowanie poziomów (220)
- Parametry statystyki opisowej z uwzględnieniem poziomu (220)
- Indeksowanie z kolumnami ramki danych (221)
- 8.2. Łączenie zbiorów danych (222)
- Łączenie ramek danych w stylu łączenia elementów baz danych (222)
- Łączenie przy użyciu indeksu (227)
- Konkatenacja wzdłuż osi (230)
- Łączenie częściowo nakładających się danych (234)
- 8.3. Zmiana kształtu i operacje osiowe (235)
- Przekształcenia z indeksowaniem hierarchicznym (236)
- Przekształcanie z formatu "długiego" na "szeroki" (238)
- Przekształcanie z formatu "szerokiego" na "długi" (241)
- 8.4. Podsumowanie (243)
- 9.1. Podstawy obsługi interfejsu pakietu matplotlib (245)
- Obiekty figure i wykresy składowe (246)
- Kolory, oznaczenia i style linii (250)
- Punkty, etykiety i legendy (252)
- Adnotacje i rysunki (255)
- Zapisywanie wykresów w postaci plików (257)
- Konfiguracja pakietu matplotlib (258)
- 9.2. Generowanie wykresów za pomocą pakietów pandas i seaborn (259)
- Wykresy liniowe (259)
- Wykresy słupkowe (262)
- Histogramy i wykresy gęstości (266)
- Wykresy punktowe (268)
- Wykresy panelowe i dane kategoryczne (269)
- 9.3. Inne narzędzia przeznaczone do wizualizacji danych w Pythonie (272)
- 9.4. Podsumowanie (272)
- 10.1. Mechanika interfejsu groupby (274)
- Iteracja po grupach (277)
- Wybieranie kolumny lub podzbioru kolumn (278)
- Grupowanie przy użyciu słowników i serii (279)
- Grupowanie przy użyciu funkcji (280)
- Grupowanie przy użyciu poziomów indeksu (280)
- 10.2. Agregacja danych (281)
- Przetwarzanie kolumna po kolumnie i stosowanie wielu funkcji (282)
- Zwracanie zagregowanych danych bez indeksów wierszy (285)
- 10.3. Metoda apply - ogólne zastosowanie techniki dziel-zastosuj-połącz (286)
- Usuwanie kluczy grup (288)
- Kwantyle i analiza koszykowa (288)
- Przykład: wypełnianie brakujących wartości przy użyciu wartości charakterystycznych dla grupy (290)
- Przykład: losowe generowanie próbek i permutacja (292)
- Przykład: średnie ważone grup i współczynnik korelacji (293)
- Przykład: regresja liniowa grup (295)
- 10.4. Tabele przestawne i krzyżowe (295)
- Tabele krzyżowe (298)
- 10.5. Podsumowanie (299)
- 11.1. Typy danych i narzędzia przeznaczone do obsługi daty i czasu (302)
- Konwersja pomiędzy obiektami string i datetime (303)
- 11.2. Podstawy szeregów czasowych (305)
- Indeksowanie i wybieranie (306)
- Szeregi czasowe z duplikatami indeksów (309)
- 11.3. Zakresy dat, częstotliwości i przesunięcia (310)
- Generowanie zakresów dat (310)
- Częstotliwości i przesunięcia daty (313)
- Przesuwanie daty (314)
- 11.4. Obsługa strefy czasowej (317)
- Lokalizacja i konwersja stref czasowych (317)
- Operacje z udziałem obiektów Timestamp o wyznaczonej strefie czasowej (319)
- Operacje pomiędzy różnymi strefami czasowymi (320)
- 11.5. Okresy i przeprowadzanie na nich operacji matematycznych (321)
- Konwersja częstotliwości łańcuchów (322)
- Kwartalne częstotliwości okresów (323)
- Konwersja znaczników czasu na okresy (i z powrotem) (325)
- Tworzenie obiektów PeriodIndex na podstawie tablic (326)
- 11.6. Zmiana rozdzielczości i konwersja częstotliwości (328)
- Zmniejszanie częstotliwości (329)
- Zwiększanie rozdzielczości i interpolacja (332)
- Zmiana rozdzielczości z okresami (333)
- 11.7. Funkcje ruchomego okna (334)
- Funkcje ważone wykładniczo (337)
- Binarne funkcje ruchomego okna (338)
- Funkcje ruchomego okna definiowane przez użytkownika (340)
- 11.8. Podsumowanie (340)
- 12.1. Dane kategoryczne (341)
- Kontekst i motywacja (341)
- Typ Categorical w bibliotece pandas (343)
- Obliczenia na obiektach typu Categorical (345)
- Metody obiektu kategorycznego (347)
- 12.2. Zaawansowane operacje grupowania (349)
- Transformacje grup i "nieobudowane" operacje grupowania (349)
- Zmiana rozdzielczości czasu przeprowadzana przy użyciu grup (353)
- 12.3. Techniki łączenia metod w łańcuch (354)
- Metoda pipe (355)
- 12.4. Podsumowanie (356)
- 13.1. Łączenie pandas z kodem modelu (357)
- 13.2. Tworzenie opisów modeli przy użyciu biblioteki Patsy (360)
- Przekształcenia danych za pomocą formuł Patsy (362)
- Patsy i dane kategoryczne (363)
- 13.3. Wprowadzenie do biblioteki statsmodels (366)
- Szacowanie modeli liniowych (366)
- Szacowanie procesów szeregów czasowych (369)
- 13.4. Wprowadzenie do pakietu scikit-learn (369)
- 13.5. Dalszy rozwój (373)
- 14.1. Dane USA.gov serwisu Bitly (375)
- Liczenie stref czasowych w czystym Pythonie (376)
- Liczenie stref czasowych przy użyciu pakietu pandas (378)
- 14.2. Zbiór danych MovieLens 1M (384)
- Wyznaczenie rozbieżności ocen (388)
- 14.3. Imiona nadawane dzieciom w USA w latach 1880 - 2010 (389)
- Analiza trendów imion (394)
- 14.4. Baza danych USDA Food (402)
- 14.5. Baza danych 2012 Federal Election Commission (406)
- Statystyki datków z podziałem na wykonywany zawód i pracodawcę (409)
- Podział kwot datków na koszyki (411)
- Statystyki datków z podziałem na poszczególne stany (413)
- 14.6. Podsumowanie (414)
- A.1. Szczegóły budowy obiektu ndarray (415)
- Hierarchia typów danych NumPy (416)
- A.2. Zaawansowane operacje tablicowe (417)
- Zmiana wymiarów tablic (417)
- Kolejności charakterystyczne dla języków C i Fortran (419)
- Łączenie i dzielenie tablic (420)
- Powtarzanie elementów - funkcje tile i repeat (422)
- Alternatywy indeksowania specjalnego - metody take i put (423)
- A.3. Rozgłaszanie (424)
- Rozgłaszanie wzdłuż innych osi (426)
- Przypisywanie wartości elementom tablicy poprzez rozgłaszanie (428)
- A.4. Zaawansowane zastosowania funkcji uniwersalnych (429)
- Metody instancji funkcji uniwersalnych (429)
- Pisanie nowych funkcji uniwersalnych w Pythonie (431)
- A.5. Tablice o złożonej strukturze (432)
- Zagnieżdżone typy danych i pola wielowymiarowe (433)
- Do czego przydają się tablice o złożonej strukturze? (434)
- A.6. Jeszcze coś o sortowaniu (434)
- Sortowanie pośrednie - metody argsort i lexsort (435)
- Alternatywne algorytmy sortowania (436)
- Częściowe sortowanie tablic (437)
- Wyszukiwanie elementów w posortowanej tablicy za pomocą metody numpy.searchsorted (438)
- A.7. Pisanie szybkich funkcji NumPy za pomocą pakietu Numba (439)
- Tworzenie obiektów numpy.ufunc za pomocą pakietu Numba (440)
- A.8. Zaawansowane tablicowe operacje wejścia i wyjścia (441)
- Pliki mapowane w pamięci (441)
- HDF5 i inne możliwości zapisu tablic (442)
- A.9. Jak zachować wysoką wydajność? (442)
- Dlaczego warto korzystać z sąsiadujących ze sobą obszarów pamięci? (443)
- B.1. Korzystanie z historii poleceń (445)
- Przeszukiwanie i korzystanie z historii poleceń (445)
- Zmienne wejściowe i wyjściowe (446)
- B.2. Interakcja z systemem operacyjnym (447)
- Polecenia powłoki systemowej i aliasy (447)
- System tworzenia skrótów do katalogów (448)
- B.3. Narzędzia programistyczne (449)
- Interaktywny debuger (449)
- Pomiar czasu - funkcje %time i %timeit (453)
- Podstawowe profilowanie - funkcje %prun i %run-p (455)
- Profilowanie funkcji linia po linii (457)
- B.4. Wskazówki dotyczące produktywnego tworzenia kodu w środowisku IPython (458)
- Przeładowywanie modułów (459)
- Wskazówki dotyczące projektowania kodu (460)
- B.5. Zaawansowane funkcje środowiska IPython (461)
- Co zrobić, aby własne klasy były przyjazne dla systemu IPython? (461)
- Profile i konfiguracja (462)
Przedmowa (11)
1. Wstęp (15)
2. Podstawy Pythona oraz obsługi narzędzi IPython i Jupyter (29)
3. Wbudowane struktury danych, funkcje i pliki (61)
4. Podstawy biblioteki NumPy: obsługa tablic i wektorów (93)
5. Rozpoczynamy pracę z biblioteką pandas (127)
6. Odczyt i zapis danych, formaty plików (167)
7. Czyszczenie i przygotowywanie danych (189)
8. Przetwarzanie danych - operacje łączenia, wiązania i przekształcania (217)
9. Wykresy i wizualizacja danych (245)
10. Agregacja danych i operacje wykonywane na grupach (273)
11. Szeregi czasowe (301)
12. Zaawansowane funkcje biblioteki pandas (341)
13. Wprowadzenie do bibliotek modelujących (357)
14. Przykłady analizy danych (375)
A. Zaawansowane zagadnienia związane z biblioteką NumPy (415)
B. Dodatkowe informacje dotyczące systemu IPython (445)
Skorowidz (465)
Helion - inne książki
-
Trudno wyobrazić sobie dzisiejszy świat bez możliwości operowania na danych - tym samym bez arkuszy kalkulacyjnych, do których każdy z nas ma dostęp w swoich komputerach. Najpopularniejszy z nich, czyli Excel, jest masowo używany zarówno w firmach, jak i instytucjach publicznych, ale także w gosp...(31.92 zł najniższa cena z 30 dni)
31.92 zł
39.90 zł(-20%) -
Ta książka jest oficjalnym przewodnikiem po języku programowania systemów Rust, udostępnianym na licencji open source. Dzięki niej nauczysz się pisać szybsze i bardziej niezawodne oprogramowanie. Dowiesz się również, jak zapewnić sobie kontrolę nad niskopoziomowymi szczegółami wraz z wysokopoziom...(103.20 zł najniższa cena z 30 dni)
103.20 zł
129.00 zł(-20%) -
Marzycie czasem, że potraficie latać niczym ptak? Szybowanie bez trudu ponad wierzchołkami drzew, wznoszenie się i opadanie, zabawa i uniki w trzecim wymiarze. Kiedy w Anglii wystukuję na klawiaturze niniejsze wyrazy, te „lecą” do chmury, gotowe „wylądować” w amerykańskim ...(55.20 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
Dzięki tej książce ta trudna sztuka musi Ci się udać! Znajdziesz tu gruntowne, a przy tym zabawne wprowadzenie do tworzenia i używania struktur danych. Naukę oprzesz na przejrzystych schematach i dowcipnych porównaniach, aby już wkrótce móc tworzyć wydajniejszy i elastyczny kod. Nieistotne, jakim...(55.20 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
Wszystkie znaki na niebie i ziemi wskazują wyraźnie: wkraczamy w erę, w której sztuczna inteligencja (SI) będzie wszechobecna. Wygra na tym ten, kto szybciej nauczy się z nią skutecznie porozumiewać. Nie czekaj zatem i już dziś opanuj sztukę tworzenia precyzyjnych i trafnych promptów, czyli instr...(38.35 zł najniższa cena z 30 dni)
41.30 zł
59.00 zł(-30%) -
Niezależnie od poziomu doświadczenia ten praktyczny przewodnik ułatwi Ci opanowanie Go. Znajdziesz tu kluczowe informacje, dzięki którym nauczysz się tworzyć przejrzysty, idiomatyczny kod w Go i myśleć jak programista Go. To wydanie uwzględnia nowości, które zostały udostępnione w ciągu ostatnich...(64.35 zł najniższa cena z 30 dni)
69.30 zł
99.00 zł(-30%) -
Najnowsze wydanie przewodnika, zaktualizowane pod kątem systemu Windows Server 2022, to bogate źródło wiedzy dla administratora serwerów. Przedstawia zasady instalacji i konfiguracji tego systemu, a także sposoby korzystania z centralnych narzędzi do administracji. Książka w głównej mierze jest p...(96.85 zł najniższa cena z 30 dni)
104.30 zł
149.00 zł(-30%) -
Ta książka koncentruje się głównie na rozwijaniu repozytorium kodu, czyli tworzeniu grafu commitów zawierających poszczególne wersje. Do realizacji tego zadania idealnym, bo najpotężniejszym narzędziem jest wiersz poleceń - i właśnie z niego korzystamy w poradniku. Druga kwestia, którą się zajmuj...(23.94 zł najniższa cena z 30 dni)
27.93 zł
39.90 zł(-30%) -
Ta książka objaśnia, na czym polega istota ścieżki technicznej — z zaznaczeniem, że umiejętność dostosowania aspiracji konkretnej osoby do potrzeb organizacji jest sztuką, szczególnie w wypadku inżynierów, którzy mają wnieść istotny wkład na wysokim poziomie. Dzięki lekturze zrozumiesz swoj...(44.94 zł najniższa cena z 30 dni)
52.43 zł
74.90 zł(-30%) -
W tej książce omówiono wewnętrzny sposób działania frameworka Kubernetes i pokazano, jak za jego pomocą budować wydajne, niezawodne i odporne na awarie aplikacje natywnej chmury. Dowiesz się, jak kontenery używają przestrzeni nazw w celu izolowania procesów, a także jak korzystają z funkcjonalnoś...(53.40 zł najniższa cena z 30 dni)
62.30 zł
89.00 zł(-30%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Zamknij
Przeczytaj darmowy fragment
Oceny i opinie klientów: Python w analizie danych. Przetwarzanie danych za pomocą pakietów Pandas i NumPy oraz środowiska IPython. Wydanie II Wes McKinney (4) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.
(3)
(1)
(0)
(0)
(0)
(0)
Oceny i opinie poprzedniego wydania
więcej opinii