Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
- Autorzy:
- Peter Bruce, Andrew Bruce, Peter Gedeck
- Wydawnictwo:
- Helion
- Wydawnictwo:
- Helion
- Ocena:
- 4.0/6 Opinie: 7
- Stron:
- 296
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
![Wyłącznie](https://static01.helion.com.pl/ebookpoint/img/img_wylacznie.png)
Opis ebooka: Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
Metody statystyczne są kluczowym narzędziem w data science, mimo to niewielu analityków danych zdobyło wykształcenie w ich zakresie. Może im to utrudniać uzyskiwanie dobrych efektów. Zrozumienie praktycznych zasad statystyki okazuje się ważne również dla programistów R i Pythona, którzy tworzą rozwiązania dla data science. Kursy podstaw statystyki rzadko jednak uwzględniają tę perspektywę, a większość podręczników do statystyki w ogóle nie zajmuje się narzędziami wywodzącymi się z informatyki.
To drugie wydanie popularnego podręcznika statystyki przeznaczonego dla analityków danych. Uzupełniono je o obszerne przykłady w Pythonie oraz wyjaśnienie, jak stosować poszczególne metody statystyczne w problemach data science, a także jak ich nie używać. Skoncentrowano się też na tych zagadnieniach statystyki, które odgrywają istotną rolę w data science. Wyjaśniono, które koncepcje są ważne i przydatne z tej perspektywy, a które mniej istotne i dlaczego. Co ważne, poszczególne koncepcje i zagadnienia praktyczne przedstawiono w sposób przyswajalny i zrozumiały również dla osób nienawykłych do posługiwania się statystyką na co dzień.
W książce między innymi:
- analiza eksploracyjna we wstępnym badaniu danych
- próby losowe a jakość dużych zbiorów danych
- podstawy planowania eksperymentów
- regresja w szacowaniu wyników i wykrywaniu anomalii
- statystyczne uczenie maszynowe
- uczenie nienadzorowane a znaczenie danych niesklasyfikowanych
Statystyka: klasyczne narzędzia w najnowszych technologiach!
Metody statystyczne są kluczowym elementem data science, mimo to niewielu specjalistów data science posiada formalne wykształcenie statystyczne. Kursy i podręczniki o podstawach statystyki, rzadko kiedy omawiają temat z perspektywy data science. W drugim wydaniu tego popularnego podręcznika zostały dodane obszerne przykłady w Pythonie, wytłumaczono, w jaki sposób stosować poszczególne metody statystyczne w problemach data science, a także jak ich nie używać. Książka ta dostarczy Ci również wskazówek o tym jakie zagadnienia są istotne, a jakie nie.
Wiele materiałów z dziedziny data science zawiera metody statystyczne, ale niewiele z nich omawia je z szerszej perspektywy. Jeśli jesteś zaznajomiony z językami programowania R i Pythonem oraz miałeś styczność ze statystyką, to szybkie źródło informacji uzupełni wszystkie luki w przystępny i czytelny sposób.
Ta książka nauczy Cię:
- Dlaczego analiza eksploracyjna jest kluczowym krokiem wstępnej analizy w data science
- W jaki sposób próby losowe mogą zminimalizować obciążenie i podnieść jakość zbioru danych, nawet dla big data
- W jaki sposób podstawy planowania eksperymentów dostarczają ostatecznych odpowiedzi na zadane pytania
- W jaki sposób wykorzystać regresję do oszacowania wyników i wykrywania anomalii
- Kluczowych technik klasyfikacji do prognozowania kategorii w zbiorach danych
- Metod statystycznego uczenia maszynowego, które "uczą się" z danych
- Metod uczenia nienadzorowanego dostarczających znaczenia dla danych niesklasyfikowanych
Ta książka nie jest kolejnym podręcznikiem do statystyki, czy uczenia maszynowego. Jest znacznie lepsza: dzięki przystępnej formie i licznym przykładom stanowi połączenie pomiędzy praktycznymi zagadnieniami i podstawami statystyki a współczesną praktyką i językiem data mining. Stanowi fantastyczne źródło informacji zarówno dla początkujących jak i weteranów data science.
Galit Shmueli, Główny autor bestsellerowej serii Data Mining for Business Analytics, i Uznany Profesor, National Tsing Hua University w Taiwanie
![Pakuj ebook do walizki - lipcowe zaczytanie do -45%!](https://static01.helion.com.pl/ebookpoint/img/promocje/bannery/19618/box_1180x419_SM_ebp_pakuj_ebook_do_walizki_6fa867313.png)
Wybrane bestsellery
-
Statistical methods are a key part of data science, yet few data scientists have formal statistical training. Courses and books on basic statistics rarely cover the topic from a data science perspective. The second edition of this popular guide adds comprehensive examples in Python, provides prac...
Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition Practical Statistics for Data Scientists. 50+ Essential Concepts Using R and Python. 2nd Edition
(211.65 zł najniższa cena z 30 dni)216.58 zł
259.00 zł(-16%) -
Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych...
Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym
(55.20 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Ta książka wyjaśni Ci rolę matematyki w tworzeniu, renderowaniu i zmienianiu wirtualnych środowisk 3D, a ponadto pozwoli odkryć tajemnice najpopularniejszych dzisiaj silników gier. Za sprawą licznych praktycznych ćwiczeń zorientujesz się, co się kryje za rysowaniem linii i kształtów graficznych, ...
Matematyka w programowaniu gier i grafice komputerowej. Tworzenie i renderowanie wirtualnych środowisk 3D oraz praca z nimi Matematyka w programowaniu gier i grafice komputerowej. Tworzenie i renderowanie wirtualnych środowisk 3D oraz praca z nimi
(62.30 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
To czwarte, zaktualizowane wydanie znakomitego przewodnika poświęconego zastosowaniu uczenia maszynowego do rozwiązywania rzeczywistych problemów w analizie danych. Dzięki książce dowiesz się wszystkiego, co trzeba wiedzieć o wstępnym przetwarzaniu danych, znajdowaniu kluczowych spostrzeżeń, prog...
Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV
(83.40 zł najniższa cena z 30 dni)97.30 zł
139.00 zł(-30%) -
Sztuczna inteligencja przyczyniła się do prawdziwej rewolucji technologicznej i zmieniła branżę informatyczną. Po funkcje oparte na AI chętnie sięgnął Microsoft, by udoskonalić swój wiodący produkt – Excela. AI poprzez zaawansowane algorytmy potrafi automatycznie analizować i interpretować ...
AI w Excelu. Kurs video. Automatyzacja zadań w pracy AI w Excelu. Kurs video. Automatyzacja zadań w pracy
(99.59 zł najniższa cena z 30 dni)161.84 zł
249.00 zł(-35%) -
Pytest – nowoczesny framework do uruchamiania testów automatycznych w języku Python. Można używać tej platformy do przeprowadzania testów jednostkowych, ale sprawdzi się świetnie także podczas konstruowania rozbudowanych testów wyższego poziomu (integracyjnych, end-to-end) dla całych aplika...
Pytest. Kurs video. Automatyzacja testów w Pythonie Pytest. Kurs video. Automatyzacja testów w Pythonie
(44.70 zł najniższa cena z 30 dni)96.85 zł
149.00 zł(-35%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Sposobów na naukę Pythona jest sporo i powstało na ten temat mnóstwo publikacji. Jeżeli ten wybór jest właśnie przed Tobą, rozważ naukę Pythona poprzez tworzenie prostych gier. Ich programowanie to nie tylko świetna zabawa, ale też doskonała metoda rozwijania umiejętności algorytmicznych, kreatyw...
Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm
(51.60 zł najniższa cena z 30 dni)64.50 zł
129.00 zł(-50%) -
Statystyka to dziedzina wiedzy, która bazuje na danych – przedmiotem jej zainteresowania są metody ich pozyskiwania i prezentacji, a przede wszystkim analizy. W ostatnich latach mocno zyskuje na popularności i dziś niemal każda uczelnia w Polsce oferuje możliwość studiowania na kierunku zwi...
Statystyka. Kurs video. Przewodnik dla studentów kierunków ścisłych Statystyka. Kurs video. Przewodnik dla studentów kierunków ścisłych
(39.90 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
Oto drugie, zaktualizowane wydanie znakomitego przewodnika dla analityków danych. Dzięki niemu dowiesz się, w jaki sposób używać języka R do importowania, przekształcania i wizualizowania danych, a także do przekazywania uzyskanych wyników analizy. Nauczysz się też rozwiązywać najczęściej występu...
Język R w data science. Importowanie, porządkowanie, przekształcanie, wizualizowanie i modelowanie danych. Wydanie II Język R w data science. Importowanie, porządkowanie, przekształcanie, wizualizowanie i modelowanie danych. Wydanie II
(77.40 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%)
O autorach ebooka
Peter Bruce jest ekspertem w dziedzinie nauczania statystyki. Prowadzi Institute for Statistics Education, gdzie oferuje setki kursów skierowanych między innymi do naukowców.
Dr Andrew Bruce jest głównym analitykiem w Amazonie. Od trzydziestu lat zajmuje się statystyką i nauką o danych, opracowując rozwiązania problemów z wielu branż.
Dr Peter Gedeck jest badaczem w Collaborative Drug Discovery. Tworzy algorytmy uczenia maszynowego do przewidywania właściwości substancji stanowiących potencjalne leki.
Zobacz pozostałe książki z serii
-
To drugie, zaktualizowane wydanie przewodnika po systemie Prometheus. Znajdziesz w nim wyczerpujące wprowadzenie do tego oprogramowania, a także wskazówki dotyczące monitorowania aplikacji i infrastruktury, tworzenia wykresów, przekazywania ostrzeżeń, bezpośredniej instrumentacji kodu i pobierani...
Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Dzięki tej książce zrozumiesz bazowe koncepcje programowania funkcyjnego i przekonasz się, że możesz włączać je do kodu bez rezygnacji z paradygmatu obiektowego. Dowiesz się również, kiedy w swojej codziennej pracy używać takich opcji jak niemutowalność i funkcje czyste i dlaczego warto to robić....
Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego
(52.20 zł najniższa cena z 30 dni)60.90 zł
87.00 zł(-30%) -
Ta książka będzie świetnym uzupełnieniem wiedzy o Flutterze i Darcie, sprawdzi się również jako wsparcie podczas rozwiązywania konkretnych problemów. Znalazło się tu ponad sto receptur, dzięki którym poznasz tajniki pisania efektywnego kodu, korzystania z narzędzi udostępnianych przez framework F...
Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Ten przewodnik, który docenią programiści i architekci, zawiera wyczerpujące omówienie zagadnień projektowania, funkcjonowania i modyfikowania architektury API. Od strony praktycznej przedstawia strategie budowania i testowania API REST umożliwiającego połączenie oferowanej funkcjonalności na poz...
Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
W tej książce omówiono ponad 20 najprzydatniejszych wzorców projektowych, dzięki którym tworzone aplikacje internetowe będą łatwe w późniejszej obsłudze technicznej i w trakcie skalowania. Poza wzorcami projektowymi przedstawiono wzorce generowania i wydajności działania, których znaczenie dla uż...
Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
To gruntownie zaktualizowane i uzupełnione wydanie praktycznego przewodnika po wdrażaniu i testowaniu kontenerów Dockera. Przedstawia proces przygotowania pakietu aplikacji ze wszystkimi ich zależnościami, a także jego testowania, wdrażania, skalowania i utrzymywania w środowiskach produkcyjnych....
Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III
(52.20 zł najniższa cena z 30 dni)60.90 zł
87.00 zł(-30%) -
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...
Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie
(46.20 zł najniższa cena z 30 dni)53.90 zł
77.00 zł(-30%) -
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięk...
Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II
(77.40 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%) -
Oto kolejne wydanie zwięzłego podręcznika dla programistów Javy, który ma ułatwić maksymalne wykorzystanie technologii tego języka w wersji 17. Treść została skrupulatnie przejrzana i uzupełniona o materiał dotyczący nowości w obiektowym modelu Javy. Pierwsza część książki obejmuje wprowadzenie d...(53.40 zł najniższa cena z 30 dni)
62.30 zł
89.00 zł(-30%) -
Dzięki tej książce dowiesz się, w jaki sposób uczynić architekturę oprogramowania wystarczająco plastyczną, aby mogła odzwierciedlać zachodzące zmiany biznesowe i technologiczne. W nowym wydaniu rozbudowano pojęcia zmiany kierowanej i przyrostowej, a także przedstawiono najnowsze techniki dotyczą...
Architektura ewolucyjna. Projektowanie oprogramowania i wsparcie zmian. Wydanie II Architektura ewolucyjna. Projektowanie oprogramowania i wsparcie zmian. Wydanie II
(40.20 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%)
Ebooka "Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2nd Edition
- Tłumaczenie:
- Krzysztof Sawka, Marta Danch-Wierzchowska
- ISBN Książki drukowanej:
- 978-83-283-7427-0, 9788328374270
- Data wydania książki drukowanej:
- 2021-06-16
- ISBN Ebooka:
- 978-83-283-7428-7, 9788328374287
- Data wydania ebooka:
-
2021-06-16
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 168x237
- Numer z katalogu:
- 142553
- Rozmiar pliku Pdf:
- 10.5MB
- Rozmiar pliku ePub:
- 8.2MB
- Rozmiar pliku Mobi:
- 16.2MB
- Pobierz przykładowy rozdział PDF
- Przykłady na ftp
Ebook zawiera materiały dodatkowe, które możesz pobrać z serwera FTP - link znajdziesz na stronie redakcyjnej.
Spis treści ebooka
- Przedmowa
- Konwencja zastosowana w tej książce
- Wykorzystanie przykładów kodu
- Podziękowania
- Rozdział 1. Badania eksploracyjne
- Elementy danych uporządkowanych
- Dla pogłębienia wiedzy
- Elementy danych uporządkowanych
- Dane stabelaryzowane
- Ramki danych i indeksy
- Niestabelaryzowane struktury danych
- Dla pogłębienia wiedzy
- Miary położenia
- Średnia
- Mediana i estymatory odporne
- Wartości odstające
- Przykład: miara położenia dla wielkości populacji i wskaźnika morderstw
- Dla pogłębienia wiedzy
- Miary rozproszenia
- Odchylenie standardowe i powiązane estymatory
- Estymatory oparte na percentylach
- Przykład: szacowanie zmienności dla populacji Stanów Zjednoczonych
- Dla pogłębienia wiedzy
- Badanie rozkładu danych
- Percentyle i boxploty
- Tablica częstości i histogramy
- Szacowanie i wykresy gęstości rozkładu
- Dla pogłębienia wiedzy
- Badanie danych binarnych i skategoryzowanych
- Moda
- Wartość oczekiwana
- Prawdopodobieństwo
- Dla pogłębienia wiedzy
- Korelacja
- Wykres punktowy
- Dla pogłębienia wiedzy
- Badanie dwóch lub więcej zmiennych
- Wykres przedziałów heksagonalnych i wykres konturowy (przedstawianie danych numerycznych względem danych numerycznych)
- Dwie zmienne skategoryzowane
- Dane kategoryzowane i numeryczne
- Wizualizacja wielu zmiennych
- Dla pogłębienia wiedzy
- Podsumowanie
- Rozdział 2. Rozkłady danych i prób
- Losowy dobór i obciążenie próby
- Obciążenie
- Dobór losowy
- Rozmiar a jakość: kiedy rozmiar ma znaczenie?
- Średnia z próby a średnia z populacji
- Dla pogłębienia wiedzy
- Losowy dobór i obciążenie próby
- Błąd doboru
- Regresja do średniej
- Dla pogłębienia wiedzy
- Rozkład próbkowania dla statystyki
- Centralne twierdzenie graniczne
- Błąd standardowy
- Dla pogłębienia wiedzy
- Próby bootstrapowe
- Ponowne próbkowanie a próby bootstrapowe
- Dla pogłębienia wiedzy
- Przedziały ufności
- Dla pogłębienia wiedzy
- Rozkład normalny
- Standaryzowany rozkład normalny i wykres K-K
- Rozkłady z długimi ogonami
- Dla pogłębienia wiedzy
- Rozkład t-Studenta
- Dla pogłębienia wiedzy
- Rozkład binarny
- Dla pogłębienia wiedzy
- Rozkład chi-kwadrat
- Dla pogłębienia wiedzy
- Rozkład F
- Dla pogłębienia wiedzy
- Rozkład Poissona i jego pochodne
- Rozkład Poissona
- Rozkład wykładniczy
- Szacowanie współczynnika porażki
- Rozkład Weibulla
- Dla pogłębienia wiedzy
- Podsumowanie
- Rozdział 3. Eksperymenty statystyczne i testowanie istotności
- Test A/B
- Po co Ci grupa kontrolna?
- Dlaczego tylko A/B? Dlaczego nie C, D itd.?
- Dla pogłębienia wiedzy
- Test A/B
- Testowanie hipotezy
- Hipoteza zerowa
- Hipoteza alternatywna
- Test jednostronny i test dwustronny
- Dla pogłębienia wiedzy
- Testy randomizacyjne
- Test permutacyjny
- Przykład: licznik odwiedzin strony
- Zupełny test permutacyjny i bootstrap
- Test permutacyjny: podstawa w data science
- Dla pogłębienia wiedzy
- Istotność statystyczna i p-wartość
- p-wartość
- Alfa
- Kontrowersje związane z p-wartością
- Istotność praktyczna
- Błędy pierwszego i drugiego rodzaju
- Data science i p-wartość
- Dla pogłębienia wiedzy
- Test t
- Dla pogłębienia wiedzy
- Testowanie wielokrotne
- Dla pogłębienia wiedzy
- Stopnie swobody
- Dla pogłębienia wiedzy
- ANOVA
- Statystyka F
- Dwustronna ANOVA
- Dla pogłębienia wiedzy
- Test chi-kwadrat
- Test chi-kwadrat: podejście randomizacyjne
- Test chi-kwadrat: teoria
- Dokładny test Fishera
- Znaczenie testu chi-kwadrat w data science
- Dla pogłębienia wiedzy
- Algorytm Wielorękiego Bandyty
- Dla pogłębienia wiedzy
- Moc i rozmiar próby
- Rozmiar próby
- Dla pogłębienia wiedzy
- Podsumowanie
- Rozdział 4. Regresja i predykcja
- Prosta regresja liniowa
- Równanie regresji
- Dopasowanie wartości i rezydua
- Metoda najmniejszych kwadratów
- Predykcja a objaśnienie (profilowanie)
- Dla pogłębienia wiedzy
- Prosta regresja liniowa
- Regresja wieloraka
- Przykład: wartość domów w King County
- Ocena modelu
- Kroswalidacja
- Dobór modelu i regresja krokowa
- Regresja ważona
- Dla pogłębienia wiedzy
- Predykcja z wykorzystaniem regresji
- Niebezpieczeństwa związane z ekstrapolacją
- Przedziały ufności i predykcji
- Zmienne skategoryzowane w regresji
- Zmienne fikcyjne
- Zmienne skategoryzowane na wielu poziomach
- Uporządkowane zmienne skategoryzowane
- Interpretacja równania regresji
- Predyktory skorelowane
- Współliniowość
- Zmienne zakłócające
- Interakcje i efekty główne
- Diagnostyka regresji
- Wartości odstające
- Obserwacje wpływowe
- Heteroskedastyczność, anormalność i błędy skorelowane
- Wykresy częściowych rezyduów i nieliniowość
- Regresja wielomianowa i regresja sklejana
- Wielomian
- Funkcja sklejana
- Uogólnione modele addytywne
- Dla pogłębienia wiedzy
- Podsumowanie
- Rozdział 5. Klasyfikacja
- Naiwny klasyfikator bayesowski
- Dlaczego klasyfikator bayesowski jest niepraktyczny?
- Naiwne rozwiązanie
- Numeryczne zmienne objaśniające
- Dla pogłębienia wiedzy
- Naiwny klasyfikator bayesowski
- Analiza dyskryminacyjna
- Macierz kowariancji
- Liniowy dyskryminator Fishera
- Prosty przykład
- Dla pogłębienia wiedzy
- Regresja logistyczna
- Funkcja odpowiedzi logistycznej i logit
- Regresja logistyczna i GLM
- Uogólnione modele liniowe
- Wartości prognozowane na podstawie regresji logistycznej
- Interpretacja współczynników i iloraz szans
- Regresja liniowa i regresja logistyczna: podobieństwa i różnice
- Dopasowanie modelu
- Ocena modelu
- Analiza reszt
- Dla pogłębienia wiedzy
- Ewaluacja modeli klasyfikacji
- Macierz błędów
- Problem mało licznych klas
- Precyzja, czułość i swoistość
- Krzywa ROC
- Pole pod wykresem krzywej ROC
- Lift
- Dla pogłębienia wiedzy
- Strategie dla niezbilansowanych danych
- Undersampling
- Oversampling i zwiększenie/obniżenie wag
- Generowanie danych
- Klasyfikacja oparta na kosztach
- Badanie prognozy
- Dla pogłębienia wiedzy
- Podsumowanie
- Rozdział 6. Statystyczne uczenie maszynowe
- K-najbliższych sąsiadów
- Przykład: przewidywanie opóźnienia w spłacie pożyczki
- Metryki odległości
- Kodowanie 1 z n
- Standaryzacja (normalizacja, z-wartość)
- Dobór K
- KNN w doborze cech
- K-najbliższych sąsiadów
- Drzewa decyzyjne
- Prosty przykład
- Algorytm rekursywnego podziału
- Pomiar homogeniczności lub zanieczyszczenia
- Zatrzymanie wzrostu drzewa
- Kontrolowanie złożoności drzewa w R
- Kontrolowanie złożoności drzewa w Pythonie
- Prognoza ciągłych wartości
- Jak są wykorzystywane drzewa
- Dla pogłębienia wiedzy
- Bagging i lasy losowe
- Bagging
- Las losowy
- Istotność zmiennej
- Hiperparametry
- Boosting
- Algorytm wzmacniania
- XGBoost
- Regularyzacja: unikanie nadmiernego dopasowania
- Hiperparametry i kroswalidacja
- Podsumowanie
- Rozdział 7. Uczenie nienadzorowane
- Analiza głównych składowych
- Prosty przykład
- Obliczanie głównych składowych
- Interpretacja głównych składowych
- Analiza odpowiedniości
- Dla pogłębienia wiedzy
- Analiza głównych składowych
- Metoda K-średnich (centroidów)
- Prosty przykład
- Algorytm K-średnich
- Interpretacja klastrów
- Dobór liczby klastrów
- Klasteryzacja hierarchiczna
- Prosty przykład
- Dendrogram
- Algorytm aglomeracyjny
- Miary podobieństwa
- Klasteryzacja oparta na modelu
- Wielowymiarowy rozkład normalny
- Mieszaniny rozkładów normalnych
- Dobór liczby klastrów
- Dla pogłębienia wiedzy
- Skalowanie i zmienne skategoryzowane
- Skalowanie zmiennych
- Zmienne dominujące
- Zmienne skategoryzowane i odległość Gowera
- Problem z klasteryzacją danych mieszanych
- Podsumowanie
- Bibliografia
- O autorach
- Kolofon
Helion - inne książki
-
Dzięki tej świetnie napisanej, miejscami przezabawnej książce dowiesz się, na czym naprawdę polega testowanie granic bezpieczeństwa fizycznego. To fascynująca relacja o sposobach wynajdywania niedoskonałości zabezpieczeń, stosowania socjotechnik i wykorzystywania słabych stron ludzkiej natury. Wy...(47.20 zł najniższa cena z 30 dni)
41.30 zł
59.00 zł(-30%) -
Ta książka zawiera szereg praktycznych wskazówek dotyczących przygotowania, przeprowadzania i oceniania wyników kontrolowanych eksperymentów online. Dzięki niej nauczysz się stosować naukowe podejście do formułowania założeń i oceny hipotez w testach A/B, dowiesz się także, jak sprawdzać wiarygod...
Kontrolowane eksperymenty online. Praktyczny przewodnik po testach A/B Kontrolowane eksperymenty online. Praktyczny przewodnik po testach A/B
(63.20 zł najniższa cena z 30 dni)55.30 zł
79.00 zł(-30%) -
Współpraca z ChatGPT wymaga pewnego przygotowania. Niewątpliwą zaletą tej technologii jest to, że można się z nią porozumieć za pomocą języka naturalnego ― takiego, jakim komunikujemy się ze sobą na co dzień. Rzecz w tym, by nauczyć się w odpowiedni sposób zadawać pytania i wydawać poleceni...(34.93 zł najniższa cena z 30 dni)
34.93 zł
49.90 zł(-30%) -
Dzięki tej książce poznasz od podstaw Gita i GitLaba. Dowiesz się, jak skonfigurować runnery GitLaba, a także jak tworzyć i konfigurować potoki dla różnych etapów cyklu rozwoju oprogramowania. Poznasz zasady interpretacji wyników potoków w GitLabie. Nauczysz się też wdrażania kodu w różnych środo...
Automatyzacja metodyki DevOps za pomocą potoków CI/CD GitLaba. Buduj efektywne potoki CI/CD do weryfikacji, zabezpieczenia i wdrażania kodu, korzystając z rzeczywistych przykładów Automatyzacja metodyki DevOps za pomocą potoków CI/CD GitLaba. Buduj efektywne potoki CI/CD do weryfikacji, zabezpieczenia i wdrażania kodu, korzystając z rzeczywistych przykładów
(55.30 zł najniższa cena z 30 dni)55.30 zł
79.00 zł(-30%) -
ChatGPT, chatbot opracowany i udostępniony przez firmę OpenAI, szybko stał się obiektem zainteresowania internautów na całym świecie — i na nowo wzbudził gorące dyskusje wokół sztucznej inteligencji. Ludzie mediów prześcigają się w skrajnych wizjach, jedni podchodzą do tematu entuzjastyczni...(10.95 zł najniższa cena z 30 dni)
12.04 zł
21.90 zł(-45%) -
Dzięki tej książce łatwo przyswoisz teoretyczne podstawy i zaczniesz je płynnie wdrażać w rzeczywistych scenariuszach. Dowiesz się, w jaki sposób myślenie przyczynowe ułatwia rozwiązywanie problemów, i poznasz pojęcia Pearla, takie jak strukturalny model przyczynowy, interwencje, kontrfakty itp. ...
Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko
(65.40 zł najniższa cena z 30 dni)76.30 zł
109.00 zł(-30%) -
Na matematykę w szkole kładzie się bardzo duży nacisk. Uczymy się jej przez wiele lat, rozwiązujemy tysiące zadań, często zmagamy się z nią na egzaminach wstępnych i końcowych. Wydawałoby się, że jako ludzie dorośli powinniśmy ją mieć w małym palcu. A jednak mniejsze i większe matematyczne wyzwan...(23.40 zł najniższa cena z 30 dni)
27.30 zł
39.00 zł(-30%) -
Tę książkę docenią przede wszystkim inżynierowie oprogramowania, programiści i administratorzy systemów, którzy muszą szybko zrozumieć praktyki DevOps. Znajdziesz tu bezcenną wiedzę, która ułatwi Ci efektywną pracę z nowoczesnym stosem aplikacji i sprawne przystąpienie do zadań związanych z DevOp...
DevOps dla zdesperowanych. Praktyczny poradnik przetrwania DevOps dla zdesperowanych. Praktyczny poradnik przetrwania
(40.20 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
Oto przewodnik po inżynierii detekcji, przeznaczony dla inżynierów zabezpieczeń i analityków bezpieczeństwa. Zaprezentowano w nim praktyczną metodologię planowania, budowy i walidacji mechanizmów wykrywania zagrożeń. Opisano zasady pracy z frameworkami służącymi do testowania i uwierzytelniania p...
Inżynieria detekcji cyberzagrożeń w praktyce. Planowanie, tworzenie i walidacja mechanizmów wykrywania zagrożeń Inżynieria detekcji cyberzagrożeń w praktyce. Planowanie, tworzenie i walidacja mechanizmów wykrywania zagrożeń
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Autodesk Fusion 360 jest kompleksowym oprogramowaniem chmurowym, dzięki któremu stworzysz nawet bardzo rozbudowane zunifikowane projekty w 3D. W razie potrzeby wykonasz w nim również symulacje, przygotujesz dokumentację projektu i opracujesz jego dane. Fusion 360 łączy funkcje 3D CAD, CAM, CAE i ...(34.20 zł najniższa cena z 30 dni)
39.90 zł
57.00 zł(-30%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
![Loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
![ajax-loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
Oceny i opinie klientów: Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II Peter Bruce, Andrew Bruce, Peter Gedeck (7)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.
(3)
(0)
(1)
(1)
(1)
(1)
więcej opinii