Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
- Autorzy:
- Peter Bruce, Andrew Bruce, Peter Gedeck
- Wydawnictwo:
- Helion
- Wydawnictwo:
- Helion
- Ocena:
- 4.0/6 Opinie: 7
- Stron:
- 296
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Opis
książki
:
Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
Metody statystyczne są kluczowym narzędziem w data science, mimo to niewielu analityków danych zdobyło wykształcenie w ich zakresie. Może im to utrudniać uzyskiwanie dobrych efektów. Zrozumienie praktycznych zasad statystyki okazuje się ważne również dla programistów R i Pythona, którzy tworzą rozwiązania dla data science. Kursy podstaw statystyki rzadko jednak uwzględniają tę perspektywę, a większość podręczników do statystyki w ogóle nie zajmuje się narzędziami wywodzącymi się z informatyki.
To drugie wydanie popularnego podręcznika statystyki przeznaczonego dla analityków danych. Uzupełniono je o obszerne przykłady w Pythonie oraz wyjaśnienie, jak stosować poszczególne metody statystyczne w problemach data science, a także jak ich nie używać. Skoncentrowano się też na tych zagadnieniach statystyki, które odgrywają istotną rolę w data science. Wyjaśniono, które koncepcje są ważne i przydatne z tej perspektywy, a które mniej istotne i dlaczego. Co ważne, poszczególne koncepcje i zagadnienia praktyczne przedstawiono w sposób przyswajalny i zrozumiały również dla osób nienawykłych do posługiwania się statystyką na co dzień.
W książce między innymi:
- analiza eksploracyjna we wstępnym badaniu danych
- próby losowe a jakość dużych zbiorów danych
- podstawy planowania eksperymentów
- regresja w szacowaniu wyników i wykrywaniu anomalii
- statystyczne uczenie maszynowe
- uczenie nienadzorowane a znaczenie danych niesklasyfikowanych
Statystyka: klasyczne narzędzia w najnowszych technologiach!
Metody statystyczne są kluczowym elementem data science, mimo to niewielu specjalistów data science posiada formalne wykształcenie statystyczne. Kursy i podręczniki o podstawach statystyki, rzadko kiedy omawiają temat z perspektywy data science. W drugim wydaniu tego popularnego podręcznika zostały dodane obszerne przykłady w Pythonie, wytłumaczono, w jaki sposób stosować poszczególne metody statystyczne w problemach data science, a także jak ich nie używać. Książka ta dostarczy Ci również wskazówek o tym jakie zagadnienia są istotne, a jakie nie.
Wiele materiałów z dziedziny data science zawiera metody statystyczne, ale niewiele z nich omawia je z szerszej perspektywy. Jeśli jesteś zaznajomiony z językami programowania R i Pythonem oraz miałeś styczność ze statystyką, to szybkie źródło informacji uzupełni wszystkie luki w przystępny i czytelny sposób.
Ta książka nauczy Cię:
- Dlaczego analiza eksploracyjna jest kluczowym krokiem wstępnej analizy w data science
- W jaki sposób próby losowe mogą zminimalizować obciążenie i podnieść jakość zbioru danych, nawet dla big data
- W jaki sposób podstawy planowania eksperymentów dostarczają ostatecznych odpowiedzi na zadane pytania
- W jaki sposób wykorzystać regresję do oszacowania wyników i wykrywania anomalii
- Kluczowych technik klasyfikacji do prognozowania kategorii w zbiorach danych
- Metod statystycznego uczenia maszynowego, które "uczą się" z danych
- Metod uczenia nienadzorowanego dostarczających znaczenia dla danych niesklasyfikowanych
Ta książka nie jest kolejnym podręcznikiem do statystyki, czy uczenia maszynowego. Jest znacznie lepsza: dzięki przystępnej formie i licznym przykładom stanowi połączenie pomiędzy praktycznymi zagadnieniami i podstawami statystyki a współczesną praktyką i językiem data mining. Stanowi fantastyczne źródło informacji zarówno dla początkujących jak i weteranów data science.
Galit Shmueli, Główny autor bestsellerowej serii Data Mining for Business Analytics, i Uznany Profesor, National Tsing Hua University w Taiwanie
Wybrane bestsellery
-
Promocja
Statistical methods are a key part of data science, yet few data scientists have formal statistical training. Courses and books on basic statistics rarely cover the topic from a data science perspective. The second edition of this popular guide adds comprehensive examples in Python, provides practical guidance on applying statistical methods to dat- ePub + Mobi 220 pkt
(220,15 zł najniższa cena z 30 dni)
220.15 zł
269.00 zł (-18%) -
Nowość Promocja
Sztuczna inteligencja stale się rozwija. Właściwie codziennie słyszymy o jej rosnących możliwościach, nowych osiągnięciach i przyszłości, jaką nam przyniesie. Jednak w tej książce skupiamy się nie na przyszłości, a na teraźniejszości i praktycznym obliczu AI - na usługach, które świadczy już dziś. Większość najciekawszych zastosowań sztucznej inteligencji bazuje na ML (uczenie maszynowe, ang. machine learning), NLP (przetwarzanie języka naturalnego, ang. natural language processing) i architekturze RAG (ang. retrieval augmented generation) zwiększającej możliwości tzw. dużych modeli językowych (LLM, ang. large language model). Stanowią one podwaliny budowy systemów AI, bez których te systemy często wcale nie mogłyby powstać.- PDF + ePub + Mobi
- Druk 39 pkt
(37,89 zł najniższa cena z 30 dni)
39.50 zł
79.00 zł (-50%) -
Odkryj potęgę tworzenia aplikacji webowych z najpopularniejszym językiem programowania ostatnich lat! Ta obszerna, licząca ponad 500 stron publikacja to prawdziwa skarbnica wiedzy dla każdego, kto pragnie zgłębić tajniki projektowania nowoczesnych rozwiązań internetowych w Pythonie. Od fundamentów po zaawansowane techniki - ta książka przeprowadzi
- PDF + ePub + Mobi 34 pkt
-
Nowość Promocja
Ta książka ułatwi Ci zgłębienie koncepcji kryjących się za działaniem nowoczesnych baz danych. Dzięki niej zrozumiesz, w jaki sposób struktury dyskowe różnią się od tych w pamięci i jak działają algorytmy efektywnego utrzymywania struktur B drzewa na dysku. Poznasz implementacje pamięci masowej o strukturze dziennika. Znajdziesz tu również wyjaśnienie zasad organizacji węzłów w klaster baz danych i specyfiki środowisk rozproszonych. Dowiesz się, jak algorytmy rozproszone poprawiają wydajność i stabilność systemu i jak uzyskać ostateczną spójność danych. Ponadto w książce zaprezentowano koncepcje antyentropii i plotek, służące do zapewniania zbieżności i rozpowszechniania danych, a także mechanizm transakcji utrzymujący spójność logiczną bazy.- PDF + ePub + Mobi
- Druk 44 pkt
(39,90 zł najniższa cena z 30 dni)
44.50 zł
89.00 zł (-50%) -
Nowość Promocja
Przetwarzanie obrazów to dynamicznie rozwijająca się dziedzina, która znajduje zastosowanie w licznych branżach, takich jak medycyna, motoryzacja, przemysł rozrywkowy, bezpieczeństwo, rolnictwo czy marketing. Umożliwia automatyczne rozpoznawanie obiektów, analizę obrazów medycznych i tworzenie interaktywnych aplikacji korzystających ze sztucznej inteligencji. Warto się zagłębić w techniki przetwarzania obrazów, które stały się dostępniejsze i skuteczniejsze niż kiedykolwiek wcześniej dzięki lepszemu wykorzystaniu mocy obliczeniowej niezbędnej do procesowania sieci konwolucyjnych (CNN) i algorytmów YOLO. Ponadto modele generatywne, jak DALL-E czy Midjourney, oferują możliwości generowania obrazów na potrzeby trenowania modeli AI, co pozwala zwiększać różnorodność i wielkość puli danych (ang. data augmentation). Powszechnym narzędziem w segmencie computer vision jest biblioteka OpenCV. Jest używana do analizy obrazów, rozpoznawania obiektów, detekcji twarzy, wykrywania ruchu czy segmentacji obrazów. OpenCV oferuje dostęp do szerokiego zakresu narzędzi i algorytmów, a dobre opanowanie biblioteki otwiera drzwi do ciekawych projektów związanych z widzeniem komputerowym. Umiejętność przetwarzania obrazów jest niezwykle ceniona na rynku pracy – specjaliści mogą liczyć na atrakcyjne stanowiska i różnorodne wyzwania technologiczne.- Videokurs 64 pkt
(34,65 zł najniższa cena z 30 dni)
64.35 zł
99.00 zł (-35%) -
Nowość Promocja
Język programowania ogólnego przeznaczenia Python należy obecnie do najpopularniejszych na świecie. Skąd się bierze jego fenomen? Niewątpliwie kluczowe znaczenie ma tu bardzo czytelna składnia, mocno zbliżona do składni języka naturalnego. Czyni to Pythona dość łatwym do opanowania, także dla początkujących. Osoby bardziej doświadczone doceniają go za wszechstronność. Pythona można używać w różnych dziedzinach, takich jak analiza danych, sztuczna inteligencja, tworzenie stron internetowych, automatyka i automatyzacja, pisanie aplikacji mobilnych i wiele innych. Dodajmy do tego rozbudowany pakiet bibliotek standardowych i oto mamy (niemal) idealny język programowania.- PDF + ePub + Mobi
- Druk 29 pkt
(27,90 zł najniższa cena z 30 dni)
29.49 zł
59.00 zł (-50%) -
Nowość Promocja
Dzięki tej książce ta trudna sztuka musi Ci się udać! Znajdziesz tu gruntowne, a przy tym zabawne wprowadzenie do tworzenia i używania struktur danych. Naukę oprzesz na przejrzystych schematach i dowcipnych porównaniach, aby już wkrótce móc tworzyć wydajniejszy i elastyczny kod. Nieistotne, jakim językiem programowania się posługujesz — podczas lektury zaimplementujesz za pomocą pseudokodu kilkanaście głównych struktur danych, w tym stosy, filtry Blooma, drzewa czwórkowe i grafy. Fantazyjne przykłady ułatwią Ci intuicyjne posługiwanie się tymi strukturami danych. Dowiesz się, jak indeksować przedmioty kolekcjonerskie, optymalizować wyszukiwanie za pomocą latającej wiewiórki, a nawet jak znaleźć najbliższy kubek kawy!- PDF + ePub + Mobi
- Druk 34 pkt
(32,90 zł najniższa cena z 30 dni)
34.50 zł
69.00 zł (-50%) -
Nowość Promocja
Tę książkę docenią w szczególności analitycy danych. Wyjaśniono w niej potencjał wnioskowania przyczynowego w zakresie szacowania wpływu i efektów w biznesie. Opisano klasyczne metody wnioskowania przyczynowego, w tym testy A/B, regresja liniowa, wskaźnik skłonności, metoda syntetycznej kontroli i metoda różnicy w różnicach, przy czym skoncentrowano się przede wszystkim na praktycznym aspekcie tych technik. Znalazło się tu również omówienie nowoczesnych rozwiązań, takich jak wykorzystanie uczenia maszynowego do szacowania heterogenicznych efektów. Każda metoda została zilustrowana opisem zastosowania w branży technologicznej.- PDF + ePub + Mobi
- Druk 37 pkt
(35,90 zł najniższa cena z 30 dni)
37.45 zł
74.90 zł (-50%) -
Nowość Promocja
Flask jest jednym z mikroframeworków napisanych w języku Python. Przedrostek „mikro-” oznacza tyle, że framework ten nie wymaga określonych narzędzi ani bibliotek. Bazuje na użytkowych rozszerzeniach i należy do najpopularniejszych tego typu platform Pythona. Wiele firm programistycznych i samodzielnych deweloperów używa go do tworzenia nowoczesnych, skalowalnych aplikacji webowych – są wśród nich między innymi Pinterest czy LinkedIn. Elastyczność, lekkość i prostota użycia czyni z Flaska idealny wybór zarówno dla początkujących, jak i dla zaawansowanych programistów. Z jednej strony bowiem można szybko tworzyć w nim prototypy, z drugiej – Flask nadaje się idealnie do kreowania dużych, skomplikowanych aplikacji.- Videokurs 83 pkt
(39,90 zł najniższa cena z 30 dni)
83.39 zł
139.00 zł (-40%) -
Promocja
Tę książkę docenią średnio zaawansowani użytkownicy Pythona, którzy tworzą aplikacje korzystające z osiągnięć nauki o danych. Znajdziesz w niej omówienie możliwości języka, wbudowanych struktur danych Pythona, jak również takich bibliotek jak NumPy, pandas, scikit-learn i matplotlib. Nauczysz się wczytywania danych w różnych formatach, porządkowania, grupowania i agregowana zbiorów danych, a także tworzenia wykresów i map. Poszczególne zagadnienia zostały zilustrowane praktycznymi przykładami tworzenia rzeczywistych aplikacji, takich jak system obsługi taksówek z wykorzystaniem danych lokalizacyjnych, analiza reguł asocjacyjnych dla danych transakcji czy też uczenie maszynowe modelu przewidującego zmiany kursów akcji. Każdy rozdział zawiera interesujące ćwiczenia, które pozwolą Ci nabrać biegłości w stosowaniu opisanych tu technik.- PDF + ePub + Mobi
- Druk 34 pkt
(32,90 zł najniższa cena z 30 dni)
34.50 zł
69.00 zł (-50%) -
Promocja
Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych i zrozumiałych przykładów: od usprawniania działalności wypożyczalni rowerów, poprzez wyodrębnianie danych z witryn internetowych, po budowę systemów rekomendacyjnych. Poznasz rozwiązania oparte na danych, przydatne w podejmowaniu decyzji biznesowych. Nauczysz się korzystać z eksploracyjnej analizy danych, przeprowadzać testy A/B i klasyfikację binarną, a także używać algorytmów uczenia maszynowego.- PDF + ePub + Mobi
- Druk 34 pkt
(32,90 zł najniższa cena z 30 dni)
34.50 zł
69.00 zł (-50%)
O autorach książki
Peter Bruce jest ekspertem w dziedzinie nauczania statystyki. Prowadzi Institute for Statistics Education, gdzie oferuje setki kursów skierowanych między innymi do naukowców.
Dr Andrew Bruce jest głównym analitykiem w Amazonie. Od trzydziestu lat zajmuje się statystyką i nauką o danych, opracowując rozwiązania problemów z wielu branż.
Dr Peter Gedeck jest badaczem w Collaborative Drug Discovery. Tworzy algorytmy uczenia maszynowego do przewidywania właściwości substancji stanowiących potencjalne leki.
Zobacz pozostałe książki z serii
-
Promocja
To drugie, zaktualizowane wydanie przewodnika po systemie Prometheus. Znajdziesz w nim wyczerpujące wprowadzenie do tego oprogramowania, a także wskazówki dotyczące monitorowania aplikacji i infrastruktury, tworzenia wykresów, przekazywania ostrzeżeń, bezpośredniej instrumentacji kodu i pobierania wskaźników pochodzących z systemów zewnętrznych. Zrozumiesz zasady konfiguracji systemu Prometheus, komponentu Node Exporter i menedżera ostrzeżeń Alertmanager. Zapoznasz się też z nowymi funkcjonalnościami języka PromQL, dostawców mechanizmu odkrywania usług i odbiorców menedżera ostrzeżeń Alertmanager. Dokładnie zaprezentowano tu również zagadnienia bezpieczeństwa po stronie serwera, w tym mechanizm TLS i uwierzytelniania podstawowego.- PDF + ePub + Mobi
- Druk 44 pkt
(39,90 zł najniższa cena z 30 dni)
44.50 zł
89.00 zł (-50%) -
Promocja
Dzięki tej książce zrozumiesz bazowe koncepcje programowania funkcyjnego i przekonasz się, że możesz włączać je do kodu bez rezygnacji z paradygmatu obiektowego. Dowiesz się również, kiedy w swojej codziennej pracy używać takich opcji jak niemutowalność i funkcje czyste i dlaczego warto to robić. Poznasz różne aspekty FP: kompozycję, ekspresyjność, modułowość, wydajność i efektywne manipulowanie danymi. Nauczysz się korzystać z FP w celu zapewnienia wyższego bezpieczeństwa i łatwiejszego utrzymywania kodu. Te wszystkie cenne umiejętności ułatwią Ci pisanie bardziej zwięzłego, rozsądnego i przyszłościowego kodu.- PDF + ePub + Mobi
- Druk 43 pkt
(39,90 zł najniższa cena z 30 dni)
43.50 zł
87.00 zł (-50%) -
Promocja
Ta książka będzie świetnym uzupełnieniem wiedzy o Flutterze i Darcie, sprawdzi się również jako wsparcie podczas rozwiązywania konkretnych problemów. Znalazło się tu ponad sto receptur, dzięki którym poznasz tajniki pisania efektywnego kodu, korzystania z narzędzi udostępnianych przez framework Flutter czy posługiwania się rozwiązaniami dostawców usług chmurowych. Dowiesz się, jak należy pracować z bazami Firebase i platformą Google Cloud. Przy czym poszczególne receptury, poza rozwiązaniami problemów, zawierają również nieco szersze omówienia, co pozwoli Ci lepiej wykorzystać zalety Fluttera i Darta — spójnego rozwiązania do wydajnego budowania aplikacji!- PDF + ePub + Mobi
- Druk 34 pkt
(32,90 zł najniższa cena z 30 dni)
34.50 zł
69.00 zł (-50%) -
Promocja
Ten przewodnik, który docenią programiści i architekci, zawiera wyczerpujące omówienie zagadnień projektowania, funkcjonowania i modyfikowania architektury API. Od strony praktycznej przedstawia strategie budowania i testowania API REST umożliwiającego połączenie oferowanej funkcjonalności na poziomie mikrousług. Opisuje stosowanie bram API i infrastruktury typu service mesh. Autorzy dokładnie przyglądają się kwestiom zapewnienia bezpieczeństwa systemów opartych na API, w tym uwierzytelnianiu, autoryzacji i szyfrowaniu. Sporo miejsca poświęcają również ewolucji istniejących systemów w kierunku API i różnych docelowych platform.- PDF + ePub + Mobi
- Druk 34 pkt
(32,90 zł najniższa cena z 30 dni)
34.50 zł
69.00 zł (-50%) -
Promocja
W tej książce omówiono ponad 20 najprzydatniejszych wzorców projektowych, dzięki którym tworzone aplikacje internetowe będą łatwe w późniejszej obsłudze technicznej i w trakcie skalowania. Poza wzorcami projektowymi przedstawiono wzorce generowania i wydajności działania, których znaczenie dla użytkowania aplikacji jest ogromne. Opisano również nowoczesne wzorce Reacta, między innymi Zaczepy, Komponenty Wyższego Rzędu i Właściwości Generowania. Sporo miejsca poświęcono najlepszym praktykom związanym z organizacją kodu, wydajnością działania czy generowaniem, a także innym zagadnieniom, które pozwalają na podniesienie jakości aplikacji internetowych.- PDF + ePub + Mobi
- Druk 34 pkt
(32,90 zł najniższa cena z 30 dni)
34.50 zł
69.00 zł (-50%) -
Promocja
To gruntownie zaktualizowane i uzupełnione wydanie praktycznego przewodnika po wdrażaniu i testowaniu kontenerów Dockera. Przedstawia proces przygotowania pakietu aplikacji ze wszystkimi ich zależnościami, a także jego testowania, wdrażania, skalowania i utrzymywania w środowiskach produkcyjnych. Zawiera omówienie Docker Compose i trybu Docker Swarm, opis zagadnień związanych z Kubernetes, jak również przykłady optymalizacji obrazów Dockera. W tym wydaniu zaprezentowano ponadto najlepsze praktyki i narzędzie BuildKit, opisano wsparcie obrazów wieloarchitekturowych, kontenerów rootless i uwzględniono wiele innych ważnych informacji.- PDF + ePub + Mobi
- Druk 43 pkt
(39,90 zł najniższa cena z 30 dni)
43.50 zł
87.00 zł (-50%) -
Promocja
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykładami ich wykorzystania w nauce o danych, uczeniu maszynowym, uczeniu głębokim, symulacjach i przetwarzaniu danych biomedycznych. Dzięki podręcznikowi nauczysz się arytmetyki macierzowej, poznasz istotne rozkłady macierzy, w tym LU i QR, a także rozkład według wartości osobliwych, zapoznasz się też z takimi zagadnieniami jak model najmniejszych kwadratów i analiza głównych składowych.- PDF + ePub + Mobi
- Druk 38 pkt
(34,90 zł najniższa cena z 30 dni)
38.50 zł
77.00 zł (-50%) -
Promocja
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięki czemu świetnie się sprawdzi w rozwiązywaniu codziennych problemów z manipulowaniem, przekształcaniem, oczyszczaniem i wizualizacją różnych typów danych, a także jako pomoc podczas tworzenia modeli statystycznych i modeli uczenia maszynowego. Docenią go wszyscy, którzy zajmują się obliczeniami naukowymi w Pythonie.- PDF + ePub + Mobi
- Druk 64 pkt
(39,90 zł najniższa cena z 30 dni)
64.50 zł
129.00 zł (-50%) -
Promocja
Oto kolejne wydanie zwięzłego podręcznika dla programistów Javy, który ma ułatwić maksymalne wykorzystanie technologii tego języka w wersji 17. Treść została skrupulatnie przejrzana i uzupełniona o materiał dotyczący nowości w obiektowym modelu Javy. Pierwsza część książki obejmuje wprowadzenie do języka i do pracy na platformie Javy. Druga zawiera opis podstawowych pojęć i interfejsów API, których znajomość jest niezbędna każdemu programiście Javy. Mimo niewielkiej objętości w podręczniku znalazły się liczne przykłady wykorzystania potencjału tego języka programowania, a także zastosowania najlepszych praktyk programistycznych w rzeczywistej pracy.- Druk 44 pkt
(39,90 zł najniższa cena z 30 dni)
44.50 zł
89.00 zł (-50%) -
Promocja
Dzięki tej książce dowiesz się, w jaki sposób uczynić architekturę oprogramowania wystarczająco plastyczną, aby mogła odzwierciedlać zachodzące zmiany biznesowe i technologiczne. W nowym wydaniu rozbudowano pojęcia zmiany kierowanej i przyrostowej, a także przedstawiono najnowsze techniki dotyczące funkcji dopasowania, automatycznego zarządzania architekturą i danych ewolucyjnych. Zaprezentowano praktyki inżynieryjne umożliwiające ewoluowanie systemów oprogramowania, jak również podejścia strukturalne, w tym zasady projektowe, które ułatwiają zarządzanie tą ewolucją. Opisano ponadto, w jaki sposób zasady i praktyki architektury ewolucyjnej wiążą się z różnymi elementami procesu tworzenia oprogramowania.- PDF + ePub + Mobi
- Druk 33 pkt
(32,90 zł najniższa cena z 30 dni)
33.50 zł
67.00 zł (-50%)
Ebooka "Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolonych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły książki
- Tytuł oryginału:
- Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2nd Edition
- Tłumaczenie:
- Krzysztof Sawka, Marta Danch-Wierzchowska
- ISBN Książki drukowanej:
- 978-83-283-7427-0, 9788328374270
- Data wydania książki drukowanej :
- 2021-06-16
- ISBN Ebooka:
- 978-83-283-7428-7, 9788328374287
- Data wydania ebooka :
- 2021-06-16 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 168x237
- Numer z katalogu:
- 142553
- Rozmiar pliku Pdf:
- 10.5MB
- Rozmiar pliku ePub:
- 8.2MB
- Rozmiar pliku Mobi:
- 16.2MB
- Pobierz przykładowy rozdział PDF »
- Przykłady na ftp » 31.1MB
Spis treści książki
- Przedmowa
- Konwencja zastosowana w tej książce
- Wykorzystanie przykładów kodu
- Podziękowania
- Rozdział 1. Badania eksploracyjne
- Elementy danych uporządkowanych
- Dla pogłębienia wiedzy
- Dane stabelaryzowane
- Ramki danych i indeksy
- Niestabelaryzowane struktury danych
- Dla pogłębienia wiedzy
- Miary położenia
- Średnia
- Mediana i estymatory odporne
- Wartości odstające
- Przykład: miara położenia dla wielkości populacji i wskaźnika morderstw
- Dla pogłębienia wiedzy
- Miary rozproszenia
- Odchylenie standardowe i powiązane estymatory
- Estymatory oparte na percentylach
- Przykład: szacowanie zmienności dla populacji Stanów Zjednoczonych
- Dla pogłębienia wiedzy
- Badanie rozkładu danych
- Percentyle i boxploty
- Tablica częstości i histogramy
- Szacowanie i wykresy gęstości rozkładu
- Dla pogłębienia wiedzy
- Badanie danych binarnych i skategoryzowanych
- Moda
- Wartość oczekiwana
- Prawdopodobieństwo
- Dla pogłębienia wiedzy
- Korelacja
- Wykres punktowy
- Dla pogłębienia wiedzy
- Badanie dwóch lub więcej zmiennych
- Wykres przedziałów heksagonalnych i wykres konturowy (przedstawianie danych numerycznych względem danych numerycznych)
- Dwie zmienne skategoryzowane
- Dane kategoryzowane i numeryczne
- Wizualizacja wielu zmiennych
- Dla pogłębienia wiedzy
- Podsumowanie
- Elementy danych uporządkowanych
- Rozdział 2. Rozkłady danych i prób
- Losowy dobór i obciążenie próby
- Obciążenie
- Dobór losowy
- Rozmiar a jakość: kiedy rozmiar ma znaczenie?
- Średnia z próby a średnia z populacji
- Dla pogłębienia wiedzy
- Błąd doboru
- Regresja do średniej
- Dla pogłębienia wiedzy
- Rozkład próbkowania dla statystyki
- Centralne twierdzenie graniczne
- Błąd standardowy
- Dla pogłębienia wiedzy
- Próby bootstrapowe
- Ponowne próbkowanie a próby bootstrapowe
- Dla pogłębienia wiedzy
- Przedziały ufności
- Dla pogłębienia wiedzy
- Rozkład normalny
- Standaryzowany rozkład normalny i wykres K-K
- Rozkłady z długimi ogonami
- Dla pogłębienia wiedzy
- Rozkład t-Studenta
- Dla pogłębienia wiedzy
- Rozkład binarny
- Dla pogłębienia wiedzy
- Rozkład chi-kwadrat
- Dla pogłębienia wiedzy
- Rozkład F
- Dla pogłębienia wiedzy
- Rozkład Poissona i jego pochodne
- Rozkład Poissona
- Rozkład wykładniczy
- Szacowanie współczynnika porażki
- Rozkład Weibulla
- Dla pogłębienia wiedzy
- Podsumowanie
- Losowy dobór i obciążenie próby
- Rozdział 3. Eksperymenty statystyczne i testowanie istotności
- Test A/B
- Po co Ci grupa kontrolna?
- Dlaczego tylko A/B? Dlaczego nie C, D itd.?
- Dla pogłębienia wiedzy
- Testowanie hipotezy
- Hipoteza zerowa
- Hipoteza alternatywna
- Test jednostronny i test dwustronny
- Dla pogłębienia wiedzy
- Testy randomizacyjne
- Test permutacyjny
- Przykład: licznik odwiedzin strony
- Zupełny test permutacyjny i bootstrap
- Test permutacyjny: podstawa w data science
- Dla pogłębienia wiedzy
- Istotność statystyczna i p-wartość
- p-wartość
- Alfa
- Kontrowersje związane z p-wartością
- Istotność praktyczna
- Błędy pierwszego i drugiego rodzaju
- Data science i p-wartość
- Dla pogłębienia wiedzy
- Test t
- Dla pogłębienia wiedzy
- Testowanie wielokrotne
- Dla pogłębienia wiedzy
- Stopnie swobody
- Dla pogłębienia wiedzy
- ANOVA
- Statystyka F
- Dwustronna ANOVA
- Dla pogłębienia wiedzy
- Test chi-kwadrat
- Test chi-kwadrat: podejście randomizacyjne
- Test chi-kwadrat: teoria
- Dokładny test Fishera
- Znaczenie testu chi-kwadrat w data science
- Dla pogłębienia wiedzy
- Algorytm Wielorękiego Bandyty
- Dla pogłębienia wiedzy
- Moc i rozmiar próby
- Rozmiar próby
- Dla pogłębienia wiedzy
- Podsumowanie
- Test A/B
- Rozdział 4. Regresja i predykcja
- Prosta regresja liniowa
- Równanie regresji
- Dopasowanie wartości i rezydua
- Metoda najmniejszych kwadratów
- Predykcja a objaśnienie (profilowanie)
- Dla pogłębienia wiedzy
- Regresja wieloraka
- Przykład: wartość domów w King County
- Ocena modelu
- Kroswalidacja
- Dobór modelu i regresja krokowa
- Regresja ważona
- Dla pogłębienia wiedzy
- Predykcja z wykorzystaniem regresji
- Niebezpieczeństwa związane z ekstrapolacją
- Przedziały ufności i predykcji
- Zmienne skategoryzowane w regresji
- Zmienne fikcyjne
- Zmienne skategoryzowane na wielu poziomach
- Uporządkowane zmienne skategoryzowane
- Interpretacja równania regresji
- Predyktory skorelowane
- Współliniowość
- Zmienne zakłócające
- Interakcje i efekty główne
- Diagnostyka regresji
- Wartości odstające
- Obserwacje wpływowe
- Heteroskedastyczność, anormalność i błędy skorelowane
- Wykresy częściowych rezyduów i nieliniowość
- Regresja wielomianowa i regresja sklejana
- Wielomian
- Funkcja sklejana
- Uogólnione modele addytywne
- Dla pogłębienia wiedzy
- Podsumowanie
- Prosta regresja liniowa
- Rozdział 5. Klasyfikacja
- Naiwny klasyfikator bayesowski
- Dlaczego klasyfikator bayesowski jest niepraktyczny?
- Naiwne rozwiązanie
- Numeryczne zmienne objaśniające
- Dla pogłębienia wiedzy
- Analiza dyskryminacyjna
- Macierz kowariancji
- Liniowy dyskryminator Fishera
- Prosty przykład
- Dla pogłębienia wiedzy
- Regresja logistyczna
- Funkcja odpowiedzi logistycznej i logit
- Regresja logistyczna i GLM
- Uogólnione modele liniowe
- Wartości prognozowane na podstawie regresji logistycznej
- Interpretacja współczynników i iloraz szans
- Regresja liniowa i regresja logistyczna: podobieństwa i różnice
- Dopasowanie modelu
- Ocena modelu
- Analiza reszt
- Dla pogłębienia wiedzy
- Ewaluacja modeli klasyfikacji
- Macierz błędów
- Problem mało licznych klas
- Precyzja, czułość i swoistość
- Krzywa ROC
- Pole pod wykresem krzywej ROC
- Lift
- Dla pogłębienia wiedzy
- Strategie dla niezbilansowanych danych
- Undersampling
- Oversampling i zwiększenie/obniżenie wag
- Generowanie danych
- Klasyfikacja oparta na kosztach
- Badanie prognozy
- Dla pogłębienia wiedzy
- Podsumowanie
- Naiwny klasyfikator bayesowski
- Rozdział 6. Statystyczne uczenie maszynowe
- K-najbliższych sąsiadów
- Przykład: przewidywanie opóźnienia w spłacie pożyczki
- Metryki odległości
- Kodowanie 1 z n
- Standaryzacja (normalizacja, z-wartość)
- Dobór K
- KNN w doborze cech
- Drzewa decyzyjne
- Prosty przykład
- Algorytm rekursywnego podziału
- Pomiar homogeniczności lub zanieczyszczenia
- Zatrzymanie wzrostu drzewa
- Kontrolowanie złożoności drzewa w R
- Kontrolowanie złożoności drzewa w Pythonie
- Prognoza ciągłych wartości
- Jak są wykorzystywane drzewa
- Dla pogłębienia wiedzy
- Bagging i lasy losowe
- Bagging
- Las losowy
- Istotność zmiennej
- Hiperparametry
- Boosting
- Algorytm wzmacniania
- XGBoost
- Regularyzacja: unikanie nadmiernego dopasowania
- Hiperparametry i kroswalidacja
- Podsumowanie
- K-najbliższych sąsiadów
- Rozdział 7. Uczenie nienadzorowane
- Analiza głównych składowych
- Prosty przykład
- Obliczanie głównych składowych
- Interpretacja głównych składowych
- Analiza odpowiedniości
- Dla pogłębienia wiedzy
- Metoda K-średnich (centroidów)
- Prosty przykład
- Algorytm K-średnich
- Interpretacja klastrów
- Dobór liczby klastrów
- Klasteryzacja hierarchiczna
- Prosty przykład
- Dendrogram
- Algorytm aglomeracyjny
- Miary podobieństwa
- Klasteryzacja oparta na modelu
- Wielowymiarowy rozkład normalny
- Mieszaniny rozkładów normalnych
- Dobór liczby klastrów
- Dla pogłębienia wiedzy
- Skalowanie i zmienne skategoryzowane
- Skalowanie zmiennych
- Zmienne dominujące
- Zmienne skategoryzowane i odległość Gowera
- Problem z klasteryzacją danych mieszanych
- Podsumowanie
- Analiza głównych składowych
- Bibliografia
- O autorach
- Kolofon
Helion - inne książki
-
Nowość Promocja
Ta książka stanowi twardy dowód, że matematyka jest elastyczna, kreatywna i radosna. Potraktuj ją jako fascynującą podróż przez świat matematyki abstrakcyjnej do teorii kategorii. Przekonaj się, że bez formalnej wiedzy w tej dziedzinie możesz rozwinąć umiejętność matematycznego myślenia. Abstrakcyjne idee matematyczne pomogą Ci inaczej spojrzeć na aktualne wydarzenia, kwestie sprawiedliwości społecznej i przywilejów społecznych czy nawet na COVID-19.- PDF + ePub + Mobi
- Druk 29 pkt
(27,90 zł najniższa cena z 30 dni)
29.49 zł
59.00 zł (-50%) -
Nowość Promocja
Dzięki tej przystępnej książce, przeznaczonej dla programistów i badaczy, zrozumiesz podstawy techniczne modeli LLM. Dowiesz się, do czego można je zastosować, i odkryjesz elegancję ich architektury. Nauczysz się praktycznego korzystania z frameworka LangChain, zaprojektowanego do tworzenia responsywnych aplikacji. Dowiesz się, jak dostrajać model, jak zadawać mu pytania, poznasz także sprawdzone metody wdrażania i monitorowania środowisk produkcyjnych, dzięki czemu łatwo zbudujesz narzędzia do pisania, zaawansowane roboty konwersacyjne czy nowatorskie pomoce dla programistów. Liczne praktyczne przykłady i fragmenty kodu ułatwią Ci nie tylko przyswojenie podstaw, ale także używanie modeli LLM w innowacyjny i odpowiedzialny sposób.- PDF + ePub + Mobi
- Druk 39 pkt
(37,89 zł najniższa cena z 30 dni)
39.50 zł
79.00 zł (-50%) -
Nowość Promocja
W tej niezwykle pragmatycznej książce, przeznaczonej dla dyrektorów technicznych, praktyków uczenia maszynowego, twórców aplikacji, analityków biznesowych, inżynierów i badaczy danych, znajdziesz skuteczne techniki używania sztucznej inteligencji. Zaznajomisz się z cyklem życia projektu opartego na generatywnej AI i jej zastosowaniami, a także metodami doboru i dostrajania modeli, generowania danych wspomaganego wyszukiwaniem, uczenia przez wzmacnianie na podstawie informacji zwrotnych od człowieka, kwantyzacji, optymalizacji i wdrażania modeli. Poznasz szczegóły różnych typów modeli, między innymi dużych językowych (LLM), multimodalnych generujących obrazy (Stable Diffusion) i odpowiadających na pytania wizualne (Flamingo/IDEFICS).- PDF + ePub + Mobi
- Druk 39 pkt
(37,89 zł najniższa cena z 30 dni)
39.50 zł
79.00 zł (-50%) -
Nowość Promocja
Na rynku książek poświęconych analizie biznesowej w sektorze IT dostępnych jest kilka pozycji. Zawierają one informacje na temat praktyk, narzędzi i podejścia stosowanego w tej dziedzinie. Dotychczas jednak brakowało kompendium, które byłoby praktycznym przewodnikiem zbierającym doświadczenia z różnych projektów, firm i od ekspertów podchodzących w odmienny sposób do analizy biznesowej.- PDF + ePub + Mobi
- Druk 44 pkt
(39,90 zł najniższa cena z 30 dni)
44.50 zł
89.00 zł (-50%) -
Nowość Promocja
Pierwsza była wirtualizacja: oprogramowanie symuluje istnienie zasobów logicznych korzystających z zasobów fizycznych. Po niej przyszła konteneryzacja, polegająca na tworzeniu obrazów - kopii danych - zawierających wszystkie pliki potrzebne do uruchomienia danej aplikacji. Środowiska produkcyjne z obu korzystają równolegle, ale to konteneryzacja stała się swojego rodzaju rewolucją w sektorze IT. Pozwoliła bowiem na sprawniejsze wdrażanie mikroserwisów, a także na optymalizację kosztów działania wielu aplikacji.- PDF + ePub + Mobi
- Druk 19 pkt
(17,90 zł najniższa cena z 30 dni)
19.95 zł
39.90 zł (-50%) -
Nowość Promocja
FPGA pochodzi od angielskiego field-programmable gate array. Polski odpowiednik to: bezpośrednio programowalna macierz bramek. FPGA jest rodzajem programowalnego układu logicznego. Ma tę samą funkcjonalność co układ scalony, tyle że może być wielokrotnie programowany bez demontażu. Z tego powodu znajduje zastosowanie tam, gdzie wymagana jest możliwość zmiany działania, na przykład w satelitach kosmicznych. Budujesz, instalujesz w urządzeniu docelowym, a potem modyfikujesz układ w zależności od potrzeb. Brzmi praktycznie, prawda?- Druk 24 pkt
(22,90 zł najniższa cena z 30 dni)
24.95 zł
49.90 zł (-50%) -
Nowość Promocja
Trudno wyobrazić sobie dzisiejszy świat bez możliwości operowania na danych - tym samym bez arkuszy kalkulacyjnych, do których każdy z nas ma dostęp w swoich komputerach. Najpopularniejszy z nich, czyli Excel, jest masowo używany zarówno w firmach, jak i instytucjach publicznych, ale także w gospodarstwach domowych.- PDF + ePub + Mobi
- Druk 19 pkt
(17,90 zł najniższa cena z 30 dni)
19.95 zł
39.90 zł (-50%) -
Nowość Promocja
Wprowadzenie obserwowalności do systemów jest wyzwaniem technicznym i kulturowym. Dzięki tej praktycznej książce zrozumiesz wartość obserwowalnych systemów i nauczysz się praktykować programowanie sterowane obserwowalnością. Przekonasz się, że dzięki jej wdrożeniu zespoły mogą szybko i bez obaw dostarczać kod, identyfikować wartości odstające i nietypowe zachowania, a ponadto lepiej zrozumieją doświadczenia użytkownika. Znajdziesz tu szczegółowe wyjaśnienia, co jest potrzebne do uzyskania wysokiej obserwowalności, a także szereg wskazówek, jak ulepszyć istniejące rozwiązania i pomyślnie dokonać migracji ze starszych narzędzi, takich jak wskaźniki, monitorowanie i zarządzanie dziennikami. Dowiesz się również, jaki wpływ ma obserwowalność systemu na kulturę organizacji ― i odwrotnie.- PDF + ePub + Mobi
- Druk 34 pkt
(32,90 zł najniższa cena z 30 dni)
34.50 zł
69.00 zł (-50%) -
Nowość Promocja
Ta książka jest oficjalnym przewodnikiem po języku programowania systemów Rust, udostępnianym na licencji open source. Dzięki niej nauczysz się pisać szybsze i bardziej niezawodne oprogramowanie. Dowiesz się również, jak zapewnić sobie kontrolę nad niskopoziomowymi szczegółami wraz z wysokopoziomową ergonomią, co pozwoli Ci na zwiększenie produktywności i uniknięcie trudności związanych z językami niskiego poziomu. Oprócz przystępnie przekazanej wiedzy i niezliczonych przykładów kodu w książce znalazły się trzy rozdziały poświęcone budowaniu kompletnych projektów: gry w zgadywanie liczb, rustowej implementacji narzędzia wiersza poleceń i serwera wielowątkowego.- PDF + ePub + Mobi
- Druk 64 pkt
(39,90 zł najniższa cena z 30 dni)
64.50 zł
129.00 zł (-50%) -
Bestseller Nowość Promocja
Marzycie czasem, że potraficie latać niczym ptak? Szybowanie bez trudu ponad wierzchołkami drzew, wznoszenie się i opadanie, zabawa i uniki w trzecim wymiarze. Kiedy w Anglii wystukuję na klawiaturze niniejsze wyrazy, te „lecą” do chmury, gotowe „wylądować” w amerykańskim komputerze. Mogę „polecieć” wirtualnie z Oksfordu do Australii, patrząc po drodze na usytuowane „w dole” Alpy i Himalaje. Nie wiem, czy maszyny antygrawitacyjne rodem z fantastyki naukowej staną się kiedykolwiek rzeczywistością. Wątpię i nie chcę nawet snuć dalszych rozważań na ten temat. Książka, trzymając się naukowych faktów, przedstawia sposoby na pokonanie grawitacji, choć dosłownie uciec przed nią się nie da. Jak nam, ludziom, udało się z naszą technologią, i zwierzętom, z ich uwarunkowaniami biologicznymi, poradzić sobie z problemem oderwania się od stabilnego podłoża: z ucieczką, nawet jeśli tylko na jakiś czas lub częściowo, przed tyranią grawitacji? Jakie benefity w świecie natury niesie latanie?- PDF + ePub + Mobi
- Audiobook MP3
- Druk 34 pkt
(32,90 zł najniższa cena z 30 dni)
34.50 zł
69.00 zł (-50%)
Dzięki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep@ebookpoint.pl
Książka drukowana
Oceny i opinie klientów: Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II Peter Bruce, Andrew Bruce, Peter Gedeck (7) Weryfikacja opinii następuje na podstawie historii zamowień na koncie Użytkownika umiejszczającego opinię.
(3)
(0)
(1)
(1)
(1)
(1)
więcej opinii