Język R i analiza danych w praktyce. Wydanie II
- Autorzy:
- Nina Zumel, John Mount
- Wydawnictwo:
- Helion
- Wydawnictwo:
- Helion
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 560
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Opis ebooka: Język R i analiza danych w praktyce. Wydanie II
Analiza danych albo nauka o danych jest interdyscyplinarną dziedziną, dzięki której hipotezy i dane przekształca się w zrozumiałe przewidywania. Predykcyjna analiza danych przynosi wymierne korzyści w wielu dziedzinach, od polityki począwszy, a na udzielaniu kredytów skończywszy. Osobą odpowiedzialną za tę magię jest analityk danych - człowiek, który zbiera i przygotowuje dane, wybiera technikę modelowania, pisze kod, weryfikuje wyniki swojej pracy, wreszcie komunikuje je interesariuszom. Jak widać, profesja analityka danych jest wyjątkowo atrakcyjna i wyjątkowo wymagająca. Aby określić umiejętności praktyczne wymagane w zawodzie analityka danych, najlepiej prześledzić realizacje konkretnych projektów z wykorzystaniem rzeczywistych danych.
Ta książka jest samouczkiem prezentującym praktyczne aspekty dziesiątek technik, które wykorzystują profesjonalni analitycy danych. Główny nacisk autorzy położyli na zadania: ich zaplanowanie, przygotowanie, realizację i prezentację wyników. Dzięki praktycznemu podejściu z tej pozycji skorzystają zarówno analitycy biznesowi, jak i badacze danych. Pokazano tu, w jakich przypadkach i w jaki sposób należy stosować techniki statystyczne oraz metody uczenia maszynowego. W każdym rozdziale omówiono nowe narzędzia w kontekście rzeczywistych, praktycznych projektów. W rezultacie powstał potężny zbiór przydatnych ćwiczeń napisanych w języku R, opatrzonych wartościowymi wskazówkami, komentarzami i podpowiedziami.
W książce między innymi:
- zasady zarządzania procesem analizy danych
- zadania analityka danych
- przekształcanie danych w celu przygotowania ich do analizy
- techniki statystyczne i metody uczenia maszynowego w języku R
- zaawansowane metody modelowania
- tajniki skutecznego prezentowania wyników analiz
R: jesteś gotów na właściwe wyniki analizy danych?
Decyzje podejmowanie na podstawie dowodów stanowią kluczowy element sukcesu. Dzięki właściwym technikom analizy pieczołowicie dobranych danych biznesowych jesteś w stanie uzyskiwać dokładne przewidywania, rozpoznawać trendy i szybko wykrywać problemy. Platforma R zawiera narzędzia umożliwiające codzienne analizowanie danych i szybkie oraz skuteczne realizowanie zadań uczenia maszynowego.
Język R i analiza danych w praktyce. Wydanie II to zorientowany na zadania samouczek, prezentujący Czytelnikowi dziesiątki przydatnych technik analizy danych w języku R. Ten przystępny przewodnik koncentruje się na najistotniejszych zadaniach, z jakimi będziesz mierzyć się w tym zawodzie i został tak napisany, aby czerpali z niego korzyści zarówno analitycy biznesowi, jak i badacze danych. Dane są użyteczne jedynie wtedy, gdy je rozumiemy, dlatego znajdziesz tu również znakomite wskazówki dotyczące organizowania i prezentowania danych w tabelach, a także czytelnych wizualizacjach.
Znajdziesz w środku:
- Analizę statystyczną dla profesjonalistów biznesowych.
- Skuteczne prezentowanie danych.
- Najprzydatniejsze narzędzia R.
- Interpretację skomplikowanych modeli predykcyjnych.
Musisz mieć opanowaną znajomość podstaw statystyki, a także wiedzę na temat R lub innego języka programowania wysokiego poziomu.
Nina Zumel i John Mount stworzyli w San Francisco firmę doradczą z zakresu analizy danych. Obydwoje uzyskali stopień doktora na Uniwersytecie Carnegie Mellon, a także prowadzą blogi poświęcone statystyce, probabilistyce i informatyce.
"Znajdziesz tu mnóstwo przydatnego, nieskrywanego doświadczenia i praktycznych porad. Gorąco polecamy." z Przedmowy autorstwa Jeremy'ego Howarda i Rachel Thomas
"Znakomite przykłady i pouczający przewodnik po procesie analizy danych."
David Meza, NASA
"Oferuje interesujące perspektywy, ukazujące mnóstwo aspektów praktycznej analizy danych; jest to dobry punkt odniesienia."
Pascal Barbedor, BL SET
"Czy jesteś gotów na właściwe przeprowadzenie analizy danych? "
Taylor Dolezal, Disney Studios
Wybrane bestsellery
-
To czwarte, zaktualizowane wydanie znakomitego przewodnika poświęconego zastosowaniu uczenia maszynowego do rozwiązywania rzeczywistych problemów w analizie danych. Dzięki książce dowiesz się wszystkiego, co trzeba wiedzieć o wstępnym przetwarzaniu danych, znajdowaniu kluczowych spostrzeżeń, prog...
Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV Uczenie maszynowe w języku R. Tworzenie i doskonalenie modeli - od przygotowania danych po dostrajanie, ewaluację i pracę z big data. Wydanie IV
(83.40 zł najniższa cena z 30 dni)97.30 zł
139.00 zł(-30%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Statystyka to dziedzina wiedzy, która bazuje na danych – przedmiotem jej zainteresowania są metody ich pozyskiwania i prezentacji, a przede wszystkim analizy. W ostatnich latach mocno zyskuje na popularności i dziś niemal każda uczelnia w Polsce oferuje możliwość studiowania na kierunku zwi...
Statystyka. Kurs video. Przewodnik dla studentów kierunków ścisłych Statystyka. Kurs video. Przewodnik dla studentów kierunków ścisłych
(39.90 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
Oto drugie, zaktualizowane wydanie znakomitego przewodnika dla analityków danych. Dzięki niemu dowiesz się, w jaki sposób używać języka R do importowania, przekształcania i wizualizowania danych, a także do przekazywania uzyskanych wyników analizy. Nauczysz się też rozwiązywać najczęściej występu...
Język R w data science. Importowanie, porządkowanie, przekształcanie, wizualizowanie i modelowanie danych. Wydanie II Język R w data science. Importowanie, porządkowanie, przekształcanie, wizualizowanie i modelowanie danych. Wydanie II
(77.40 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%) -
Mastering Data transformation is essential for enhancing their data models and business intelligence. The Definitive Guide to Power Query equips you with the knowledge and skills to master the tool while leveraging its remarkable capabilities.
The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query
Gregory Deckler, Rick de Groot, Melissa de Korte, Brian Julius
-
Jeśli w swojej pracy masz lub miewasz do czynienia z danymi, z pewnością orientujesz się, że do tego celu stworzono dotąd całkiem sporo narzędzi. Nic dziwnego – przy tej liczbie danych, z jaką spotykamy się w dzisiejszym cyfrowym świecie, zdolność do ich sprawnego analizowania i wyciągania ...
Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym
(39.90 zł najniższa cena z 30 dni)90.34 zł
139.00 zł(-35%) -
Agile i Scrum, Scrum i Agile. Opanowawszy branżę IT, powoli, ale konsekwentnie, zdobywają inne biznesowe przyczółki i rozgaszczają się w firmach na dobre… Albo niedobre, gdy budzą niezrozumienie, protesty, a czasem nawet chęć ucieczki! Agile i Scrum brzmią tak nowocześnie, w teorii świetnie...(23.94 zł najniższa cena z 30 dni)
27.93 zł
39.90 zł(-30%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
W tej książce znajdziesz wszystkie informacje, które są Ci potrzebne do stworzenia środowiska sprzyjającego tworzeniu innowacyjnych rozwiązań. Dowiesz się, jak dostrzegać i wykorzystywać naturalne talenty każdego członka zespołu. Zapoznasz się z szeregiem praktycznych wskazówek, dzięki którym zid...
Decyzyjni. Jak zwykli ludzie kreują niezwykłe produkty Decyzyjni. Jak zwykli ludzie kreują niezwykłe produkty
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(107.40 zł najniższa cena z 30 dni)125.30 zł
179.00 zł(-30%)
O autorach ebooka
Nina Zumel pracowała jako naukowiec w SRI International, niezależnym instytucie badawczym typu non profit. Była głównym naukowcem w firmie zajmującej się optymalizacją kosztów, a także założyła firmę prowadzącą badania. Obecnie jest głównym doradcą w firmie Win Vector LLC.
John Mount pracował jako badacz obliczeniowy w biotechnologii. Zajmował się również projektowaniem algorytmów giełdowych oraz zarządzał zespołem badawczym w firmie Shopping.com. Obecnie jest głównym doradcą w firmie Win Vector LLC.
Ebooka "Język R i analiza danych w praktyce. Wydanie II" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Język R i analiza danych w praktyce. Wydanie II" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Język R i analiza danych w praktyce. Wydanie II" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Practical Data Science with R, 2nd Edition
- Tłumaczenie:
- Krzysztof Sawka
- ISBN Książki drukowanej:
- 978-83-283-6816-3, 9788328368163
- Data wydania książki drukowanej:
- 2021-01-19
- ISBN Ebooka:
- 978-83-283-6817-0, 9788328368170
- Data wydania ebooka:
- 2021-01-19 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 168x237
- Numer z katalogu:
- 125426
- Rozmiar pliku Pdf:
- 18.7MB
- Rozmiar pliku ePub:
- 25.2MB
- Rozmiar pliku Mobi:
- 49.1MB
- Pobierz przykładowy rozdział PDF
- Przykłady na ftp
Ebook zawiera materiały dodatkowe, które możesz pobrać z serwera FTP - link znajdziesz na stronie redakcyjnej.
Spis treści ebooka
- 1.1. Role w projekcie analizy danych 34
- 1.1.1. Role w projekcie 34
- 1.2. Etapy projektu analizy danych 36
- 1.2.1. Definiowanie celu 37
- 1.2.2. Gromadzenie danych i zarządzanie nimi 39
- 1.2.3. Modelowanie 41
- 1.2.4. Ocena i krytyka modelu 43
- 1.2.5. Prezentacja i dokumentowanie 45
- 1.2.6. Wdrażanie i utrzymywanie modelu 47
- 1.3. Wyznaczanie oczekiwań 47
- 1.3.1. Określenie dolnego pułapu wydajności modelu 48
- Podsumowanie 49
- 2.1. Początki z R 52
- 2.1.1. Instalowanie R, narzędzi i przykładów 53
- 2.1.2. Programowanie w R 53
- 2.2. Praca z danymi przechowywanymi w plikach 63
- 2.2.1. Praca z danymi ustrukturyzowanymi z poziomu plików lub adresów URL 63
- 2.2.2. Praca z mniej ustrukturyzowanymi danymi 68
- 2.3. Praca z relacyjnymi bazami danych 71
- 2.3.1. Przykładowe dane o rozmiarze produkcyjnym 72
- Podsumowanie 83
- 3.1. Wykrywanie problemów za pomocą statystyk podsumowujących 87
- 3.1.1. Typowe problemy wykrywane za pomocą podsumowania danych 88
- 3.2. Wykrywanie problemów za pomocą grafiki i wizualizacji 92
- 3.2.1. Wizualne sprawdzanie rozkładów dla jednej zmiennej 94
- 3.2.2. Wizualne sprawdzanie relacji pomiędzy dwiema zmiennymi 104
- Podsumowanie 119
- 4.1. Oczyszczanie danych 121
- 4.1.1. Oczyszczanie danych specyficznych dla danej dziedziny 122
- 4.1.2. Naprawianie brakujących wartości 124
- 4.1.3. Pakiet vtreat służący do automatycznego naprawiania brakujących danych 128
- 4.2. Przekształcenia danych 131
- 4.2.1. Normalizacja 132
- 4.2.2. Środkowanie i skalowanie 133
- 4.2.3. Przekształcenia logarytmiczne rozkładów nierównomiernych i szerokich 137
- 4.3. Losowanie danych do modelowania i walidacji 140
- 4.3.1. Zbiory uczący i testowy 141
- 4.3.2. Tworzenie kolumny grupowania próby 142
- 4.3.3. Grupowanie rekordów 143
- 4.3.4. Pochodzenie danych 144
- Podsumowanie 144
- 5.1. Dobieranie danych 150
- 5.1.1. Wyznaczanie podzbiorów rzędów i kolumn 150
- 5.1.2. Usuwanie rekordów z brakującymi danymi 155
- 5.1.3. Wyznaczanie kolejności rzędów 158
- 5.2. Podstawowe przekształcenia danych 162
- 5.2.1. Dodawanie nowych kolumn 162
- 5.2.2. Inne proste operacje 168
- 5.3. Przekształcenia agregacyjne 168
- 5.3.1. Łączenie wielu rzędów w rzędy podsumowujące 168
- 5.4. Wielotablicowe przekształcenia danych 172
- 5.4.1. Szybkie łączenie co najmniej dwóch uporządkowanych ramek danych 172
- 5.4.2. Główne metody łączenia danych pochodzących z wielu tabel 177
- 5.5. Transformacje przestawiające 184
- 5.5.1. Przenoszenie danych z formy szerokiej do wysokiej 184
- 5.5.2. Przenoszenie danych z formy wysokiej do szerokiej 188
- 5.5.3. Współrzędne danych 193
- Podsumowanie 194
- 6.1. Odwzorowywanie problemów na zadania uczenia maszynowego 197
- 6.1.1. Zadania klasyfikacji 199
- 6.1.2. Zadania obliczania wyniku 199
- 6.1.3. Grupowanie - praca bez znajomości zmiennych docelowych 200
- 6.1.4. Odwzorowanie problemu na metodę 202
- 6.2. Ocenianie modeli 202
- 6.2.1. Przetrenowanie 204
- 6.2.2. Wskaźniki wydajności modelu 208
- 6.2.3. Ocenianie modeli klasyfikacyjnych 209
- 6.2.4. Ocenianie modelu obliczania wyników 218
- 6.2.5. Ocenianie modeli prawdopodobieństwa 222
- 6.3. Metoda lokalnie wytłumaczalnych wyjaśnień niezależnych od modelu służąca do wyjaśniania przewidywań modelu 229
- 6.3.1. LIME - zautomatyzowane sprawdzanie poprawności działania systemu 231
- 6.3.2. Stosowanie metody LIME - mały przykład 231
- 6.3.3. Metoda LIME w klasyfikacji tekstu 238
- 6.3.4. Uczenie klasyfikatora tekstu 241
- 6.3.5. Wyjaśnianie przewidywań klasyfikatora 242
- Podsumowanie 247
- 7.1. Stosowanie regresji liniowej 250
- 7.1.1. Mechanizm działania regresji liniowej 251
- 7.1.2. Tworzenie modelu regresji liniowej 256
- 7.1.3. Uzyskiwanie predykcji 257
- 7.1.4. Wyszukiwanie relacji i wydobywanie przydatnych informacji 262
- 7.1.5. Odczytywanie podsumowania modelu i określanie jakości współczynników 264
- 7.1.6. Kluczowe wnioski na temat regresji liniowej 271
- 7.2. Stosowanie regresji logistycznej 271
- 7.2.1. Mechanizm działania regresji logistycznej 272
- 7.2.2. Tworzenie modelu regresji logistycznej 276
- 7.2.3. Uzyskiwanie przewidywań 277
- 7.2.4. Wyszukiwanie relacji i wydobywanie użytecznych informacji z modeli logistycznych 282
- 7.2.5. Odczytywanie podsumowania modelu i charakteryzowanie współczynników 284
- 7.2.6. Kluczowe wnioski na temat regresji logistycznej 291
- 7.3. Regularyzacja 291
- 7.3.1. Przykład quasi-separacji 292
- 7.3.2. Rodzaje regresji regularyzowanej 296
- 7.3.3. Regresja regularyzowana przy użyciu pakietu glmnet 298
- Podsumowanie 307
- 8.1. Cel pakietu vtreat 310
- 8.2. Konkurs KDD i zestaw danych KDD Cup 2009 312
- 8.2.1. Pierwsze kroki z danymi KDD Cup 2009 313
- 8.2.2. Metoda "słonia w składzie porcelany" 315
- 8.3. Podstawowe przygotowywanie danych do zadań klasyfikacji 318
- 8.3.1. Ramka oceny zmiennej 319
- 8.3.2. Odpowiednie stosowanie planu naprawy 324
- 8.4. Zaawansowane przygotowywanie danych do zadań klasyfikacji 325
- 8.4.1. Korzystanie z metody mkCrossFrameCExperiment() 325
- 8.4.2. Budowanie modelu 328
- 8.5. Przygotowywanie danych do zadań regresji 332
- 8.6. Opanowanie pakietu vtreat 334
- 8.6.1. Fazy mechanizmu vtreat 335
- 8.6.2. Brakujące wartości 337
- 8.6.3. Zmienne wskaźnikowe 338
- 8.6.4. Kodowanie wpływu 339
- 8.6.5. Plan naprawy 341
- 8.6.6. Ramka krzyżowa 341
- Podsumowanie 345
- 9.1. Analiza skupień 348
- 9.1.1. Odległości 349
- 9.1.2. Przygotowanie danych 352
- 9.1.3. Hierarchiczna analiza skupień za pomocą funkcji hclust() 354
- 9.1.4. Algorytm centroidów 367
- 9.1.5. Przypisywanie nowych punktów do skupień 374
- 9.1.6. Kluczowe wnioski na temat analizy skupień 376
- 9.2. Reguły asocjacyjne 377
- 9.2.1. Przegląd reguł asocjacyjnych 377
- 9.2.2. Przykładowy problem 379
- 9.2.3. Wydobywanie reguł asocjacyjnych za pomocą pakietu arules 380
- 9.2.4. Kluczowe wnioski na temat reguł asocjacyjnych 388
- Podsumowanie 388
- 10.1. Metody drzewa 393
- 10.1.1. Podstawowe drzewo decyzyjne 394
- 10.1.2. Usprawnianie przewidywań za pomocą agregacji 397
- 10.1.3. Dalsze usprawnianie przewidywań za pomocą lasów losowych 399
- 10.1.4. Drzewa wzmacniane gradientowo 405
- 10.1.5. Kluczowe wnioski na temat modeli bazujących na drzewach 414
- 10.2. Wykrywanie relacji niemonotonicznych za pomocą uogólnionych modeli addytywnych 414
- 10.2.1. Mechanizm działania modelu GAM 415
- 10.2.2. Przykład regresji jednowymiarowej 415
- 10.2.3. Wydobywanie relacji nieliniowych 420
- 10.2.4. Stosowanie modelu GAM na rzeczywistych danych 422
- 10.2.5. Stosowanie modelu GAM w regresji logistycznej 425
- 10.2.6. Kluczowe wnioski na temat modelu GAM 427
- 10.3. Rozwiązywanie problemów "nierozdzielnych" za pomocą maszyn wektorów nośnych 427
- 10.3.1. Używanie maszyn SVM do rozwiązywania problemów 428
- 10.3.2. Mechanizm działania maszyn wektorów nośnych 433
- 10.3.3. Mechanizm działania funkcji jądra 435
- 10.3.4. Kluczowe wnioski na temat maszyn wektorów nośnych i metod z użyciem jądra 438
- Podsumowanie 438
- 11.1. Przewidywanie szumu medialnego 445
- 11.2. Tworzenie dokumentacji poszczególnych etapów za pomocą formatu R Markdown 446
- 11.2.1. Czym jest R Markdown? 447
- 11.2.2. Szczegóły techniczne silnika knitr 449
- 11.2.3. Dokumentowanie danych Buzz i tworzenie modelu za pomocą pakietu knitr 450
- 11.3. Sporządzanie dokumentacji bieżącej za pomocą komentarzy i kontroli wersji 454
- 11.3.1. Pisanie przydatnych komentarzy 454
- 11.3.2. Rejestrowanie historii za pomocą kontroli wersji 456
- 11.3.3. Eksplorowanie modelu za pomocą kontroli wersji 461
- 11.3.4. Udostępnianie pracy za pomocą kontroli wersji 463
- 11.4. Wdrażanie modeli 468
- 11.4.1. Wdrażanie wersji demonstracyjnych za pomocą narzędzia Shiny 468
- 11.4.2. Wdrażanie modeli jako usług HTTP 471
- 11.4.3. Wdrażanie modeli poprzez eksportowanie 472
- 11.4.4. Kluczowe wnioski 475
- Podsumowanie 476
- 12.1. Prezentowanie rezultatów sponsorowi projektu 479
- 12.1.1. Podsumowanie celów projektu 479
- 12.1.2. Określanie wyników projektu 481
- 12.1.3. Uzupełnianie szczegółów 482
- 12.1.4. Sporządzanie zaleceń i omawianie przyszłych planów 484
- 12.1.5. Kluczowe wnioski na temat prezentacji przeznaczonej dla sponsora projektu 485
- 12.2. Prezentowanie modelu użytkownikom końcowym 485
- 12.2.1. Podsumowanie celów projektu 486
- 12.2.2. Omówienie dopasowania modelu do cyklu pracy 486
- 12.2.3. Prezentowanie sposobu korzystania z modelu 487
- 12.2.4. Kluczowe wnioski na temat prezentacji przeznaczonej dla użytkowników końcowych 489
- 12.3. Prezentowanie pracy innym analitykom danych 490
- 12.3.1. Wprowadzenie do problemu 491
- 12.3.2. Omówienie powiązanej pracy 491
- 12.3.3. Opis Twojego rozwiązania 492
- 12.3.4. Omówienie wyników i przyszłych planów 492
- 12.3.5. Kluczowe wnioski na temat prezentacji przeznaczonej dla partnerów 493
- Podsumowanie 494
Przedmowa 13
Wstęp 15
Podziękowania 17
Informacje o książce 19
Informacje o autorach 27
Informacje o autorach przedmowy 29
CZĘŚĆ I. WPROWADZENIE DO ANALIZY DANYCH 31
1. Proces analizy danych 33
2. Wprowadzenie do języka R i danych 51
3. Eksploracja danych 85
4. Zarządzanie danymi 121
5. Inżynieria i kształtowanie danych 147
CZĘŚĆ II. METODY MODELOWANIA 195
6. Wybór i ocena modeli 197
7. Regresja liniowa i logistyczna 249
8. Zaawansowane przygotowywanie danych 309
9. Metody nienadzorowane 347
10. Zaawansowane metody uczenia maszynowego 391
CZĘŚĆ III. PRACA W PRAWDZIWYM ŚWIECIE 441
11. Dokumentowanie i wdrażanie 443
12. Tworzenie użytecznych prezentacji 477
Dodatek A. Korzystanie z R i innych narzędzi 497
Dodatek B. Ważne pojęcia z dziedziny statystyki 523
Dodatek C. Bibliografia 559
Helion - inne książki
-
Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych...
Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym
(55.20 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Dzięki tej świetnie napisanej, miejscami przezabawnej książce dowiesz się, na czym naprawdę polega testowanie granic bezpieczeństwa fizycznego. To fascynująca relacja o sposobach wynajdywania niedoskonałości zabezpieczeń, stosowania socjotechnik i wykorzystywania słabych stron ludzkiej natury. Wy...(47.20 zł najniższa cena z 30 dni)
41.30 zł
59.00 zł(-30%) -
Ta książka zawiera szereg praktycznych wskazówek dotyczących przygotowania, przeprowadzania i oceniania wyników kontrolowanych eksperymentów online. Dzięki niej nauczysz się stosować naukowe podejście do formułowania założeń i oceny hipotez w testach A/B, dowiesz się także, jak sprawdzać wiarygod...
Kontrolowane eksperymenty online. Praktyczny przewodnik po testach A/B Kontrolowane eksperymenty online. Praktyczny przewodnik po testach A/B
(63.20 zł najniższa cena z 30 dni)55.30 zł
79.00 zł(-30%) -
Współpraca z ChatGPT wymaga pewnego przygotowania. Niewątpliwą zaletą tej technologii jest to, że można się z nią porozumieć za pomocą języka naturalnego ― takiego, jakim komunikujemy się ze sobą na co dzień. Rzecz w tym, by nauczyć się w odpowiedni sposób zadawać pytania i wydawać poleceni...(34.93 zł najniższa cena z 30 dni)
34.93 zł
49.90 zł(-30%) -
Dzięki tej książce poznasz od podstaw Gita i GitLaba. Dowiesz się, jak skonfigurować runnery GitLaba, a także jak tworzyć i konfigurować potoki dla różnych etapów cyklu rozwoju oprogramowania. Poznasz zasady interpretacji wyników potoków w GitLabie. Nauczysz się też wdrażania kodu w różnych środo...
Automatyzacja metodyki DevOps za pomocą potoków CI/CD GitLaba. Buduj efektywne potoki CI/CD do weryfikacji, zabezpieczenia i wdrażania kodu, korzystając z rzeczywistych przykładów Automatyzacja metodyki DevOps za pomocą potoków CI/CD GitLaba. Buduj efektywne potoki CI/CD do weryfikacji, zabezpieczenia i wdrażania kodu, korzystając z rzeczywistych przykładów
(55.30 zł najniższa cena z 30 dni)55.30 zł
79.00 zł(-30%) -
Ta książka wyjaśni Ci rolę matematyki w tworzeniu, renderowaniu i zmienianiu wirtualnych środowisk 3D, a ponadto pozwoli odkryć tajemnice najpopularniejszych dzisiaj silników gier. Za sprawą licznych praktycznych ćwiczeń zorientujesz się, co się kryje za rysowaniem linii i kształtów graficznych, ...
Matematyka w programowaniu gier i grafice komputerowej. Tworzenie i renderowanie wirtualnych środowisk 3D oraz praca z nimi Matematyka w programowaniu gier i grafice komputerowej. Tworzenie i renderowanie wirtualnych środowisk 3D oraz praca z nimi
(62.30 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
ChatGPT, chatbot opracowany i udostępniony przez firmę OpenAI, szybko stał się obiektem zainteresowania internautów na całym świecie — i na nowo wzbudził gorące dyskusje wokół sztucznej inteligencji. Ludzie mediów prześcigają się w skrajnych wizjach, jedni podchodzą do tematu entuzjastyczni...(10.95 zł najniższa cena z 30 dni)
12.04 zł
21.90 zł(-45%) -
Dzięki tej książce łatwo przyswoisz teoretyczne podstawy i zaczniesz je płynnie wdrażać w rzeczywistych scenariuszach. Dowiesz się, w jaki sposób myślenie przyczynowe ułatwia rozwiązywanie problemów, i poznasz pojęcia Pearla, takie jak strukturalny model przyczynowy, interwencje, kontrfakty itp. ...
Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko Wnioskowanie i związki przyczynowe w Pythonie. Nowoczesne uczenie maszynowe z wykorzystaniem bibliotek DoWhy, EconML, PyTorch i nie tylko
(65.40 zł najniższa cena z 30 dni)76.30 zł
109.00 zł(-30%) -
Na matematykę w szkole kładzie się bardzo duży nacisk. Uczymy się jej przez wiele lat, rozwiązujemy tysiące zadań, często zmagamy się z nią na egzaminach wstępnych i końcowych. Wydawałoby się, że jako ludzie dorośli powinniśmy ją mieć w małym palcu. A jednak mniejsze i większe matematyczne wyzwan...(23.40 zł najniższa cena z 30 dni)
27.30 zł
39.00 zł(-30%) -
Tę książkę docenią przede wszystkim inżynierowie oprogramowania, programiści i administratorzy systemów, którzy muszą szybko zrozumieć praktyki DevOps. Znajdziesz tu bezcenną wiedzę, która ułatwi Ci efektywną pracę z nowoczesnym stosem aplikacji i sprawne przystąpienie do zadań związanych z DevOp...
DevOps dla zdesperowanych. Praktyczny poradnik przetrwania DevOps dla zdesperowanych. Praktyczny poradnik przetrwania
(40.20 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Język R i analiza danych w praktyce. Wydanie II Nina Zumel, John Mount (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.