ODBIERZ TWÓJ BONUS :: »

Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II Peter Bruce, Andrew Bruce, Peter Gedeck

Autorzy:
Peter Bruce, Andrew Bruce, Peter Gedeck
Wydawnictwo:
Helion
Wydawnictwo:
Helion
Ocena:
4.3/6  Opinie: 8
Stron:
296
Druk:
oprawa miękka
Dostępne formaty:
     PDF
     ePub
     Mobi
Czytaj fragment
Książka
52,20 zł 87,00 zł (-40%)
52,20 zł najniższa cena z 30 dni

Dodaj do koszyka Wysyłamy w 24h

Ebook
43,50 zł 87,00 zł (-50%)
43,50 zł najniższa cena z 30 dni

Dodaj do koszyka lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Do przechowalni

Powiadom o dostępności audiobooka »

Czego się nauczysz?

  • Przeprowadzania eksploracyjnej analizy danych przy użyciu R i Pythona
  • Obliczania miar położenia i rozproszenia danych
  • Wykrywania i interpretowania wartości odstających w zbiorach danych
  • Analizowania rozkładów danych i korzystania z histogramów, boxplotów oraz wykresów gęstości
  • Szacowania błędu próbkowania i stosowania centralnego twierdzenia granicznego
  • Przeprowadzania prób bootstrapowych i obliczania przedziałów ufności
  • Rozróżniania i stosowania różnych rozkładów statystycznych (normalny, t-Studenta, chi-kwadrat, Poissona)
  • Projektowania eksperymentów statystycznych i wykonywania testów A/B
  • Testowania hipotez, interpretowania p-wartości oraz oceny istotności statystycznej
  • Wykorzystywania testów t, ANOVA, testów chi-kwadrat i testów permutacyjnych
  • Budowania modeli regresji liniowej i wielorakiej oraz oceny ich dopasowania
  • Przeprowadzania diagnostyki regresji i wykrywania współliniowości, wartości odstających i heteroskedastyczności
  • Tworzenia i ewaluacji modeli klasyfikacyjnych (naive Bayes, regresja logistyczna, analiza dyskryminacyjna)
  • Analizowania macierzy błędów, krzywych ROC oraz radzenia sobie z niezbilansowanymi danymi
  • Stosowania algorytmów uczenia maszynowego, takich jak KNN, drzewa decyzyjne, lasy losowe i boosting
  • Wykonywania analizy głównych składowych, klasteryzacji (K-średnich, hierarchicznej, mieszanej) oraz pracy z danymi mieszanymi

Metody statystyczne są kluczowym narzędziem w data science, mimo to niewielu analityków danych zdobyło wykształcenie w ich zakresie. Może im to utrudniać uzyskiwanie dobrych efektów. Zrozumienie praktycznych zasad statystyki okazuje się ważne również dla programistów R i Pythona, którzy tworzą rozwiązania dla data science. Kursy podstaw statystyki rzadko jednak uwzględniają tę perspektywę, a większość podręczników do statystyki w ogóle nie zajmuje się narzędziami wywodzącymi się z informatyki.

To drugie wydanie popularnego podręcznika statystyki przeznaczonego dla analityków danych. Uzupełniono je o obszerne przykłady w Pythonie oraz wyjaśnienie, jak stosować poszczególne metody statystyczne w problemach data science, a także jak ich nie używać. Skoncentrowano się też na tych zagadnieniach statystyki, które odgrywają istotną rolę w data science. Wyjaśniono, które koncepcje są ważne i przydatne z tej perspektywy, a które mniej istotne i dlaczego. Co ważne, poszczególne koncepcje i zagadnienia praktyczne przedstawiono w sposób przyswajalny i zrozumiały również dla osób nienawykłych do posługiwania się statystyką na co dzień.

W książce między innymi:

  • analiza eksploracyjna we wstępnym badaniu danych
  • próby losowe a jakość dużych zbiorów danych
  • podstawy planowania eksperymentów
  • regresja w szacowaniu wyników i wykrywaniu anomalii
  • statystyczne uczenie maszynowe
  • uczenie nienadzorowane a znaczenie danych niesklasyfikowanych

Statystyka: klasyczne narzędzia w najnowszych technologiach!

Wiosna w głowie, ebook w dłoni! / do -50% na tysiące tytułów

Wybrane bestsellery

O autorach książki

Peter Bruce jest ekspertem w dziedzinie nauczania statystyki. Prowadzi Institute for Statistics Education, gdzie oferuje setki kursów skierowanych między innymi do naukowców. 
 

Dr Andrew Bruce jest głównym analitykiem w Amazonie. Od trzydziestu lat zajmuje się statystyką i nauką o danych, opracowując rozwiązania problemów z wielu branż. 
 

Dr Peter Gedeck jest badaczem w Collaborative Drug Discovery. Tworzy algorytmy uczenia maszynowego do przewidywania właściwości substancji stanowiących potencjalne leki. 

Zobacz pozostałe książki z serii

Helion - inne książki

Najczęściej zadawane pytania (FAQ)
1. Czy książka zawiera praktyczne przykłady kodu w językach R i Python?
Tak, książka prezentuje szczegółowe przykłady kodu zarówno w R, jak i w Pythonie, co ułatwia zastosowanie omawianych metod statystycznych w praktyce data science.
2. Jakie zagadnienia statystyki są omawiane w tej książce?
Książka obejmuje 50 kluczowych zagadnień, w tym analizę eksploracyjną, rozkłady danych, testowanie hipotez, regresję, klasyfikację, uczenie maszynowe oraz metody nienadzorowane, ze szczególnym naciskiem na ich zastosowanie w data science.
3. Czy do korzystania z książki potrzebna jest zaawansowana znajomość statystyki?
Nie, książka została napisana w przystępny sposób, z myślą o osobach, które nie mają formalnego wykształcenia statystycznego - wyjaśnia kluczowe pojęcia krok po kroku i zawiera liczne przykłady.
4. Czy książka jest odpowiednia dla osób uczących się samodzielnie?
Tak, podręcznik jest świetnym wyborem do samodzielnej nauki - zawiera czytelne wyjaśnienia, praktyczne zadania oraz przykłady kodu, które można od razu wykorzystać w praktyce.
5. Czy książka pomoże mi zrozumieć, jak unikać typowych błędów w analizie danych?
Tak, autor zwraca uwagę nie tylko na poprawne wykorzystanie metod statystycznych, ale również omawia najczęstsze pułapki i błędy, pomagając ich unikać w codziennej pracy z danymi.
6. Czy znajdę tu informacje o najnowszych narzędziach i technikach wykorzystywanych w data science?
Tak, książka omawia zarówno klasyczne narzędzia statystyczne, jak i ich nowoczesne zastosowania w kontekście data science, w tym uczenie maszynowe, algorytmy klasyfikacji czy klasteryzację.
7. W jakiej formie dostępna jest książka?
Książka dostępna jest w wersji drukowanej oraz jako e-book, co pozwala wybrać najwygodniejszą formę nauki.
8. Czy książka zawiera przykłady dotyczące rzeczywistych danych?
Tak, wiele przykładów opiera się na autentycznych zbiorach danych i realnych problemach analitycznych, co pozwala lepiej zrozumieć praktyczne zastosowanie statystyki w data science.

Zamknij

Przenieś na półkę
Dodano produkt na półkę
Usunięto produkt z półki
Przeniesiono produkt do archiwum
Przeniesiono produkt do biblioteki

Zamknij

Wybierz metodę płatności

Książka
52,20 zł
Dodaj do koszyka
Ebook
43,50 zł
Dodaj do koszyka
Płatności obsługuje:
Ikona płatności Alior Bank Ikona płatności Apple Pay Ikona płatności Bank PEKAO S.A. Ikona płatności Bank Pocztowy Ikona płatności Banki Spółdzielcze Ikona płatności BLIK Ikona płatności Crédit Agricole e-przelew Ikona płatności dawny BNP Paribas Bank Ikona płatności Google Pay Ikona płatności ING Bank Śląski Ikona płatności Inteligo Ikona płatności iPKO Ikona płatności mBank Ikona płatności Millennium Ikona płatności Nest Bank Ikona płatności Paypal Ikona płatności PayPo | PayU Płacę później Ikona płatności PayU Płacę później Ikona płatności Plus Bank Ikona płatności Płacę z Citi Handlowy Ikona płatności Płacę z Getin Bank Ikona płatności Płać z BOŚ Ikona płatności Płatność online kartą płatniczą Ikona płatności Santander Ikona płatności Visa Mobile