Język R i analiza danych w praktyce. Wydanie II
- Autorzy:
- Nina Zumel, John Mount
- Wydawnictwo:
- Helion
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 560
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Opis ebooka: Język R i analiza danych w praktyce. Wydanie II
Analiza danych albo nauka o danych jest interdyscyplinarną dziedziną, dzięki której hipotezy i dane przekształca się w zrozumiałe przewidywania. Predykcyjna analiza danych przynosi wymierne korzyści w wielu dziedzinach, od polityki począwszy, a na udzielaniu kredytów skończywszy. Osobą odpowiedzialną za tę magię jest analityk danych - człowiek, który zbiera i przygotowuje dane, wybiera technikę modelowania, pisze kod, weryfikuje wyniki swojej pracy, wreszcie komunikuje je interesariuszom. Jak widać, profesja analityka danych jest wyjątkowo atrakcyjna i wyjątkowo wymagająca. Aby określić umiejętności praktyczne wymagane w zawodzie analityka danych, najlepiej prześledzić realizacje konkretnych projektów z wykorzystaniem rzeczywistych danych.
Ta książka jest samouczkiem prezentującym praktyczne aspekty dziesiątek technik, które wykorzystują profesjonalni analitycy danych. Główny nacisk autorzy położyli na zadania: ich zaplanowanie, przygotowanie, realizację i prezentację wyników. Dzięki praktycznemu podejściu z tej pozycji skorzystają zarówno analitycy biznesowi, jak i badacze danych. Pokazano tu, w jakich przypadkach i w jaki sposób należy stosować techniki statystyczne oraz metody uczenia maszynowego. W każdym rozdziale omówiono nowe narzędzia w kontekście rzeczywistych, praktycznych projektów. W rezultacie powstał potężny zbiór przydatnych ćwiczeń napisanych w języku R, opatrzonych wartościowymi wskazówkami, komentarzami i podpowiedziami.
W książce między innymi:
- zasady zarządzania procesem analizy danych
- zadania analityka danych
- przekształcanie danych w celu przygotowania ich do analizy
- techniki statystyczne i metody uczenia maszynowego w języku R
- zaawansowane metody modelowania
- tajniki skutecznego prezentowania wyników analiz
R: jesteś gotów na właściwe wyniki analizy danych?
Decyzje podejmowanie na podstawie dowodów stanowią kluczowy element sukcesu. Dzięki właściwym technikom analizy pieczołowicie dobranych danych biznesowych jesteś w stanie uzyskiwać dokładne przewidywania, rozpoznawać trendy i szybko wykrywać problemy. Platforma R zawiera narzędzia umożliwiające codzienne analizowanie danych i szybkie oraz skuteczne realizowanie zadań uczenia maszynowego.
Język R i analiza danych w praktyce. Wydanie II to zorientowany na zadania samouczek, prezentujący Czytelnikowi dziesiątki przydatnych technik analizy danych w języku R. Ten przystępny przewodnik koncentruje się na najistotniejszych zadaniach, z jakimi będziesz mierzyć się w tym zawodzie i został tak napisany, aby czerpali z niego korzyści zarówno analitycy biznesowi, jak i badacze danych. Dane są użyteczne jedynie wtedy, gdy je rozumiemy, dlatego znajdziesz tu również znakomite wskazówki dotyczące organizowania i prezentowania danych w tabelach, a także czytelnych wizualizacjach.
Znajdziesz w środku:
- Analizę statystyczną dla profesjonalistów biznesowych.
- Skuteczne prezentowanie danych.
- Najprzydatniejsze narzędzia R.
- Interpretację skomplikowanych modeli predykcyjnych.
Musisz mieć opanowaną znajomość podstaw statystyki, a także wiedzę na temat R lub innego języka programowania wysokiego poziomu.
Nina Zumel i John Mount stworzyli w San Francisco firmę doradczą z zakresu analizy danych. Obydwoje uzyskali stopień doktora na Uniwersytecie Carnegie Mellon, a także prowadzą blogi poświęcone statystyce, probabilistyce i informatyce.
"Znajdziesz tu mnóstwo przydatnego, nieskrywanego doświadczenia i praktycznych porad. Gorąco polecamy." z Przedmowy autorstwa Jeremy'ego Howarda i Rachel Thomas
"Znakomite przykłady i pouczający przewodnik po procesie analizy danych."
David Meza, NASA
"Oferuje interesujące perspektywy, ukazujące mnóstwo aspektów praktycznej analizy danych; jest to dobry punkt odniesienia."
Pascal Barbedor, BL SET
"Czy jesteś gotów na właściwe przeprowadzenie analizy danych? "
Taylor Dolezal, Disney Studios
Wybrane bestsellery
-
Tę książkę docenią wszyscy zainteresowani eksploracją danych i uczeniem maszynowym, którzy chcieliby pewnie poruszać się w świecie nauki o danych. Pokazano tu, w jaki sposób Excel pozwala zobrazować proces ich eksplorowania i jak działają poszczególne techniki w tym zakresie. Przejrzyście wyjaśni...
Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku
(43.55 zł najniższa cena z 30 dni)40.20 zł
67.00 zł(-40%) -
Power Apps to platforma stworzona przez Microsoft, umożliwiająca łatwe projektowanie, tworzenie i dostosowywanie aplikacji bez konieczności posiadania głębokiej wiedzy programistycznej. Z użyciem Power Apps można budować niestandardowe aplikacje, które efektywnie wspierają i automatyzują różne pr...
Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code
(69.65 zł najniższa cena z 30 dni)39.90 zł
199.00 zł(-80%) -
Oto zwięzłe i równocześnie praktyczne kompendium, w którym znajdziesz 20 praktyk udanego planowania, analizy, specyfikacji, walidacji i zarządzania wymaganiami. Praktyki te są odpowiednie dla projektów zarządzanych zarówno w tradycyjny, jak i zwinny sposób, niezależnie od branży. Sprawią, że zesp...
Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej
(43.55 zł najniższa cena z 30 dni)40.20 zł
67.00 zł(-40%) -
W dzisiejszej praktyce biznesowej duże znaczenie mają dane i ich analiza. W analizie zastosowanie znajduje wiele modeli statystycznych, implementowanych w różnych programach komputerowych. Na przykład Excel ma specjalny dodatek, nazwany po prostu Analiza Danych. Bardzo popularne narzędzie stanowi...
R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych
(39.90 zł najniższa cena z 30 dni)39.90 zł
149.00 zł(-73%) -
Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywisteg...
Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
(70.85 zł najniższa cena z 30 dni)65.40 zł
109.00 zł(-40%) -
Agile i Scrum, Scrum i Agile. Opanowawszy branżę IT, powoli, ale konsekwentnie, zdobywają inne biznesowe przyczółki i rozgaszczają się w firmach na dobre… Albo niedobre, gdy budzą niezrozumienie, protesty, a czasem nawet chęć ucieczki! Agile i Scrum brzmią tak nowocześnie, w teorii świetnie...(25.93 zł najniższa cena z 30 dni)
23.94 zł
39.90 zł(-40%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(44.85 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
W tej książce znajdziesz wszystkie informacje, które są Ci potrzebne do stworzenia środowiska sprzyjającego tworzeniu innowacyjnych rozwiązań. Dowiesz się, jak dostrzegać i wykorzystywać naturalne talenty każdego członka zespołu. Zapoznasz się z szeregiem praktycznych wskazówek, dzięki którym zid...
Decyzyjni. Jak zwykli ludzie kreują niezwykłe produkty Decyzyjni. Jak zwykli ludzie kreują niezwykłe produkty
(44.85 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Ta książka jest trzecim, starannie zaktualizowanym wydaniem wyczerpującego przewodnika po narzędziach analitycznych Pythona. Uwzględnia Pythona 3.0 i bibliotekę pandas 1.4. Została napisana w przystępny sposób, a poszczególne zagadnienia bogato zilustrowano przykładami, studiami rzeczywistych prz...
Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III
(77.35 zł najniższa cena z 30 dni)71.40 zł
119.00 zł(-40%) -
Oto wyczerpujący przewodnik po sposobach wykorzystywania kanałów komunikacji wirtualnej w nawiązywaniu kontaktów biznesowych i przeprowadzaniu procesów sprzedażowych w taki sposób, by zakończyły się sfinalizowaniem transakcji. Zaprezentowano tu spójny system rozmów wideo, rozmów telefonicznych, S...
Sprzedaż wirtualna, zyski realne. Jak wykorzystywać technologie do skutecznej komunikacji z nabywcami Sprzedaż wirtualna, zyski realne. Jak wykorzystywać technologie do skutecznej komunikacji z nabywcami
(17.90 zł najniższa cena z 30 dni)17.90 zł
59.00 zł(-70%)
O autorach ebooka
Nina Zumel pracowała jako naukowiec w SRI International, niezależnym instytucie badawczym typu non profit. Była głównym naukowcem w firmie zajmującej się optymalizacją kosztów, a także założyła firmę prowadzącą badania. Obecnie jest głównym doradcą w firmie Win Vector LLC.
John Mount pracował jako badacz obliczeniowy w biotechnologii. Zajmował się również projektowaniem algorytmów giełdowych oraz zarządzał zespołem badawczym w firmie Shopping.com. Obecnie jest głównym doradcą w firmie Win Vector LLC.
Ebooka "Język R i analiza danych w praktyce. Wydanie II" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Język R i analiza danych w praktyce. Wydanie II" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Język R i analiza danych w praktyce. Wydanie II" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Practical Data Science with R, 2nd Edition
- Tłumaczenie:
- Krzysztof Sawka
- ISBN Książki drukowanej:
- 978-83-283-6816-3, 9788328368163
- Data wydania książki drukowanej:
- 2021-01-19
- ISBN Ebooka:
- 978-83-283-6817-0, 9788328368170
- Data wydania ebooka:
- 2021-01-19 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 168x237
- Numer z katalogu:
- 125426
- Rozmiar pliku Pdf:
- 18.7MB
- Rozmiar pliku ePub:
- 25.2MB
- Rozmiar pliku Mobi:
- 49.1MB
- Pobierz przykładowy rozdział PDF
- Przykłady na ftp
Ebook zawiera materiały dodatkowe, które możesz pobrać z serwera FTP - link znajdziesz na stronie redakcyjnej.
Spis treści ebooka
- 1.1. Role w projekcie analizy danych 34
- 1.1.1. Role w projekcie 34
- 1.2. Etapy projektu analizy danych 36
- 1.2.1. Definiowanie celu 37
- 1.2.2. Gromadzenie danych i zarządzanie nimi 39
- 1.2.3. Modelowanie 41
- 1.2.4. Ocena i krytyka modelu 43
- 1.2.5. Prezentacja i dokumentowanie 45
- 1.2.6. Wdrażanie i utrzymywanie modelu 47
- 1.3. Wyznaczanie oczekiwań 47
- 1.3.1. Określenie dolnego pułapu wydajności modelu 48
- Podsumowanie 49
- 2.1. Początki z R 52
- 2.1.1. Instalowanie R, narzędzi i przykładów 53
- 2.1.2. Programowanie w R 53
- 2.2. Praca z danymi przechowywanymi w plikach 63
- 2.2.1. Praca z danymi ustrukturyzowanymi z poziomu plików lub adresów URL 63
- 2.2.2. Praca z mniej ustrukturyzowanymi danymi 68
- 2.3. Praca z relacyjnymi bazami danych 71
- 2.3.1. Przykładowe dane o rozmiarze produkcyjnym 72
- Podsumowanie 83
- 3.1. Wykrywanie problemów za pomocą statystyk podsumowujących 87
- 3.1.1. Typowe problemy wykrywane za pomocą podsumowania danych 88
- 3.2. Wykrywanie problemów za pomocą grafiki i wizualizacji 92
- 3.2.1. Wizualne sprawdzanie rozkładów dla jednej zmiennej 94
- 3.2.2. Wizualne sprawdzanie relacji pomiędzy dwiema zmiennymi 104
- Podsumowanie 119
- 4.1. Oczyszczanie danych 121
- 4.1.1. Oczyszczanie danych specyficznych dla danej dziedziny 122
- 4.1.2. Naprawianie brakujących wartości 124
- 4.1.3. Pakiet vtreat służący do automatycznego naprawiania brakujących danych 128
- 4.2. Przekształcenia danych 131
- 4.2.1. Normalizacja 132
- 4.2.2. Środkowanie i skalowanie 133
- 4.2.3. Przekształcenia logarytmiczne rozkładów nierównomiernych i szerokich 137
- 4.3. Losowanie danych do modelowania i walidacji 140
- 4.3.1. Zbiory uczący i testowy 141
- 4.3.2. Tworzenie kolumny grupowania próby 142
- 4.3.3. Grupowanie rekordów 143
- 4.3.4. Pochodzenie danych 144
- Podsumowanie 144
- 5.1. Dobieranie danych 150
- 5.1.1. Wyznaczanie podzbiorów rzędów i kolumn 150
- 5.1.2. Usuwanie rekordów z brakującymi danymi 155
- 5.1.3. Wyznaczanie kolejności rzędów 158
- 5.2. Podstawowe przekształcenia danych 162
- 5.2.1. Dodawanie nowych kolumn 162
- 5.2.2. Inne proste operacje 168
- 5.3. Przekształcenia agregacyjne 168
- 5.3.1. Łączenie wielu rzędów w rzędy podsumowujące 168
- 5.4. Wielotablicowe przekształcenia danych 172
- 5.4.1. Szybkie łączenie co najmniej dwóch uporządkowanych ramek danych 172
- 5.4.2. Główne metody łączenia danych pochodzących z wielu tabel 177
- 5.5. Transformacje przestawiające 184
- 5.5.1. Przenoszenie danych z formy szerokiej do wysokiej 184
- 5.5.2. Przenoszenie danych z formy wysokiej do szerokiej 188
- 5.5.3. Współrzędne danych 193
- Podsumowanie 194
- 6.1. Odwzorowywanie problemów na zadania uczenia maszynowego 197
- 6.1.1. Zadania klasyfikacji 199
- 6.1.2. Zadania obliczania wyniku 199
- 6.1.3. Grupowanie - praca bez znajomości zmiennych docelowych 200
- 6.1.4. Odwzorowanie problemu na metodę 202
- 6.2. Ocenianie modeli 202
- 6.2.1. Przetrenowanie 204
- 6.2.2. Wskaźniki wydajności modelu 208
- 6.2.3. Ocenianie modeli klasyfikacyjnych 209
- 6.2.4. Ocenianie modelu obliczania wyników 218
- 6.2.5. Ocenianie modeli prawdopodobieństwa 222
- 6.3. Metoda lokalnie wytłumaczalnych wyjaśnień niezależnych od modelu służąca do wyjaśniania przewidywań modelu 229
- 6.3.1. LIME - zautomatyzowane sprawdzanie poprawności działania systemu 231
- 6.3.2. Stosowanie metody LIME - mały przykład 231
- 6.3.3. Metoda LIME w klasyfikacji tekstu 238
- 6.3.4. Uczenie klasyfikatora tekstu 241
- 6.3.5. Wyjaśnianie przewidywań klasyfikatora 242
- Podsumowanie 247
- 7.1. Stosowanie regresji liniowej 250
- 7.1.1. Mechanizm działania regresji liniowej 251
- 7.1.2. Tworzenie modelu regresji liniowej 256
- 7.1.3. Uzyskiwanie predykcji 257
- 7.1.4. Wyszukiwanie relacji i wydobywanie przydatnych informacji 262
- 7.1.5. Odczytywanie podsumowania modelu i określanie jakości współczynników 264
- 7.1.6. Kluczowe wnioski na temat regresji liniowej 271
- 7.2. Stosowanie regresji logistycznej 271
- 7.2.1. Mechanizm działania regresji logistycznej 272
- 7.2.2. Tworzenie modelu regresji logistycznej 276
- 7.2.3. Uzyskiwanie przewidywań 277
- 7.2.4. Wyszukiwanie relacji i wydobywanie użytecznych informacji z modeli logistycznych 282
- 7.2.5. Odczytywanie podsumowania modelu i charakteryzowanie współczynników 284
- 7.2.6. Kluczowe wnioski na temat regresji logistycznej 291
- 7.3. Regularyzacja 291
- 7.3.1. Przykład quasi-separacji 292
- 7.3.2. Rodzaje regresji regularyzowanej 296
- 7.3.3. Regresja regularyzowana przy użyciu pakietu glmnet 298
- Podsumowanie 307
- 8.1. Cel pakietu vtreat 310
- 8.2. Konkurs KDD i zestaw danych KDD Cup 2009 312
- 8.2.1. Pierwsze kroki z danymi KDD Cup 2009 313
- 8.2.2. Metoda "słonia w składzie porcelany" 315
- 8.3. Podstawowe przygotowywanie danych do zadań klasyfikacji 318
- 8.3.1. Ramka oceny zmiennej 319
- 8.3.2. Odpowiednie stosowanie planu naprawy 324
- 8.4. Zaawansowane przygotowywanie danych do zadań klasyfikacji 325
- 8.4.1. Korzystanie z metody mkCrossFrameCExperiment() 325
- 8.4.2. Budowanie modelu 328
- 8.5. Przygotowywanie danych do zadań regresji 332
- 8.6. Opanowanie pakietu vtreat 334
- 8.6.1. Fazy mechanizmu vtreat 335
- 8.6.2. Brakujące wartości 337
- 8.6.3. Zmienne wskaźnikowe 338
- 8.6.4. Kodowanie wpływu 339
- 8.6.5. Plan naprawy 341
- 8.6.6. Ramka krzyżowa 341
- Podsumowanie 345
- 9.1. Analiza skupień 348
- 9.1.1. Odległości 349
- 9.1.2. Przygotowanie danych 352
- 9.1.3. Hierarchiczna analiza skupień za pomocą funkcji hclust() 354
- 9.1.4. Algorytm centroidów 367
- 9.1.5. Przypisywanie nowych punktów do skupień 374
- 9.1.6. Kluczowe wnioski na temat analizy skupień 376
- 9.2. Reguły asocjacyjne 377
- 9.2.1. Przegląd reguł asocjacyjnych 377
- 9.2.2. Przykładowy problem 379
- 9.2.3. Wydobywanie reguł asocjacyjnych za pomocą pakietu arules 380
- 9.2.4. Kluczowe wnioski na temat reguł asocjacyjnych 388
- Podsumowanie 388
- 10.1. Metody drzewa 393
- 10.1.1. Podstawowe drzewo decyzyjne 394
- 10.1.2. Usprawnianie przewidywań za pomocą agregacji 397
- 10.1.3. Dalsze usprawnianie przewidywań za pomocą lasów losowych 399
- 10.1.4. Drzewa wzmacniane gradientowo 405
- 10.1.5. Kluczowe wnioski na temat modeli bazujących na drzewach 414
- 10.2. Wykrywanie relacji niemonotonicznych za pomocą uogólnionych modeli addytywnych 414
- 10.2.1. Mechanizm działania modelu GAM 415
- 10.2.2. Przykład regresji jednowymiarowej 415
- 10.2.3. Wydobywanie relacji nieliniowych 420
- 10.2.4. Stosowanie modelu GAM na rzeczywistych danych 422
- 10.2.5. Stosowanie modelu GAM w regresji logistycznej 425
- 10.2.6. Kluczowe wnioski na temat modelu GAM 427
- 10.3. Rozwiązywanie problemów "nierozdzielnych" za pomocą maszyn wektorów nośnych 427
- 10.3.1. Używanie maszyn SVM do rozwiązywania problemów 428
- 10.3.2. Mechanizm działania maszyn wektorów nośnych 433
- 10.3.3. Mechanizm działania funkcji jądra 435
- 10.3.4. Kluczowe wnioski na temat maszyn wektorów nośnych i metod z użyciem jądra 438
- Podsumowanie 438
- 11.1. Przewidywanie szumu medialnego 445
- 11.2. Tworzenie dokumentacji poszczególnych etapów za pomocą formatu R Markdown 446
- 11.2.1. Czym jest R Markdown? 447
- 11.2.2. Szczegóły techniczne silnika knitr 449
- 11.2.3. Dokumentowanie danych Buzz i tworzenie modelu za pomocą pakietu knitr 450
- 11.3. Sporządzanie dokumentacji bieżącej za pomocą komentarzy i kontroli wersji 454
- 11.3.1. Pisanie przydatnych komentarzy 454
- 11.3.2. Rejestrowanie historii za pomocą kontroli wersji 456
- 11.3.3. Eksplorowanie modelu za pomocą kontroli wersji 461
- 11.3.4. Udostępnianie pracy za pomocą kontroli wersji 463
- 11.4. Wdrażanie modeli 468
- 11.4.1. Wdrażanie wersji demonstracyjnych za pomocą narzędzia Shiny 468
- 11.4.2. Wdrażanie modeli jako usług HTTP 471
- 11.4.3. Wdrażanie modeli poprzez eksportowanie 472
- 11.4.4. Kluczowe wnioski 475
- Podsumowanie 476
- 12.1. Prezentowanie rezultatów sponsorowi projektu 479
- 12.1.1. Podsumowanie celów projektu 479
- 12.1.2. Określanie wyników projektu 481
- 12.1.3. Uzupełnianie szczegółów 482
- 12.1.4. Sporządzanie zaleceń i omawianie przyszłych planów 484
- 12.1.5. Kluczowe wnioski na temat prezentacji przeznaczonej dla sponsora projektu 485
- 12.2. Prezentowanie modelu użytkownikom końcowym 485
- 12.2.1. Podsumowanie celów projektu 486
- 12.2.2. Omówienie dopasowania modelu do cyklu pracy 486
- 12.2.3. Prezentowanie sposobu korzystania z modelu 487
- 12.2.4. Kluczowe wnioski na temat prezentacji przeznaczonej dla użytkowników końcowych 489
- 12.3. Prezentowanie pracy innym analitykom danych 490
- 12.3.1. Wprowadzenie do problemu 491
- 12.3.2. Omówienie powiązanej pracy 491
- 12.3.3. Opis Twojego rozwiązania 492
- 12.3.4. Omówienie wyników i przyszłych planów 492
- 12.3.5. Kluczowe wnioski na temat prezentacji przeznaczonej dla partnerów 493
- Podsumowanie 494
Przedmowa 13
Wstęp 15
Podziękowania 17
Informacje o książce 19
Informacje o autorach 27
Informacje o autorach przedmowy 29
CZĘŚĆ I. WPROWADZENIE DO ANALIZY DANYCH 31
1. Proces analizy danych 33
2. Wprowadzenie do języka R i danych 51
3. Eksploracja danych 85
4. Zarządzanie danymi 121
5. Inżynieria i kształtowanie danych 147
CZĘŚĆ II. METODY MODELOWANIA 195
6. Wybór i ocena modeli 197
7. Regresja liniowa i logistyczna 249
8. Zaawansowane przygotowywanie danych 309
9. Metody nienadzorowane 347
10. Zaawansowane metody uczenia maszynowego 391
CZĘŚĆ III. PRACA W PRAWDZIWYM ŚWIECIE 441
11. Dokumentowanie i wdrażanie 443
12. Tworzenie użytecznych prezentacji 477
Dodatek A. Korzystanie z R i innych narzędzi 497
Dodatek B. Ważne pojęcia z dziedziny statystyki 523
Dodatek C. Bibliografia 559
Helion - inne książki
-
ChatGPT wywołał wstrząs w branży technologicznej. Programiści i wynalazcy otrzymali niesamowite możliwości dostępne na wyciągnięcie ręki. Interfejs API OpenAI i towarzyszące mu biblioteki stanowią gotowe rozwiązanie dla każdego twórcy aplikacji opartych na sztucznej inteligencji. Programista za p...
Tworzenie aplikacji z wykorzystaniem GPT-4 i ChatGPT. Buduj inteligentne chatboty, generatory treści i fascynujące projekty Tworzenie aplikacji z wykorzystaniem GPT-4 i ChatGPT. Buduj inteligentne chatboty, generatory treści i fascynujące projekty
(47.20 zł najniższa cena z 30 dni)35.40 zł
59.00 zł(-40%) -
Ta książka pomoże Ci się przygotować do pracy na stanowisku testera oprogramowania, a także zapewni wsparcie podczas wykonywania nowych zadań. Znajdziesz tu dokładne omówienie podstaw testowania, jego różnych rodzajów i poziomów w odniesieniu do zastosowania na różnych etapach pracy nad projektem...
Tester samouk. Praktyczny przewodnik po testowaniu oprogramowania na bazie gotowego projektu Tester samouk. Praktyczny przewodnik po testowaniu oprogramowania na bazie gotowego projektu
(47.20 zł najniższa cena z 30 dni)35.40 zł
59.00 zł(-40%) -
Czym jest inżynieria wymagań? To systematyczne podejście do pozyskiwania i dokumentowania wymagań, a także zarządzania nimi. Polega na zrozumieniu potrzeb i oczekiwań interesariuszy, a następnie opisaniu, za pomocą wymagań, systemu, który je spełnia.
Certyfikowany inżynier wymagań. Na podstawie IREB CPRE. Poziom podstawowy Certyfikowany inżynier wymagań. Na podstawie IREB CPRE. Poziom podstawowy
(55.20 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Dzięki tej książce nauczysz się gromadzić publicznie dostępne informacje, korzystać z wiedzy o cyklu życia wrażliwych danych i przekształcać je w informacje wywiadowcze przydatne dla zespołów zajmujących się bezpieczeństwem. Opanujesz proces gromadzenia i analizy danych, poznasz również strategie...
Prawdziwa głębia OSINT. Odkryj wartość danych Open Source Intelligence Prawdziwa głębia OSINT. Odkryj wartość danych Open Source Intelligence
(79.20 zł najniższa cena z 30 dni)59.40 zł
99.00 zł(-40%) -
Oto kompleksowe omówienie sposobów wdrażania najnowszych dostępnych środków zabezpieczających systemy linuksowe. Z książki dowiesz się, jak skonfigurować laboratorium do ćwiczeń praktycznych, tworzyć konta użytkowników z odpowiednimi poziomami uprawnień, chronić dane dzięki uprawnieniom i szyfrow...
Bezpieczeństwo systemu Linux. Hardening i najnowsze techniki zabezpieczania przed cyberatakami. Wydanie III Bezpieczeństwo systemu Linux. Hardening i najnowsze techniki zabezpieczania przed cyberatakami. Wydanie III
(83.85 zł najniższa cena z 30 dni)77.40 zł
129.00 zł(-40%) -
To dziewiąte wydanie znakomitego podręcznika programowania dla początkujących, starannie zaktualizowane i uzupełnione o informacje dotyczące Java Platform, Standard Edition 17. Książka rozpoczyna się od solidnej dawki wiedzy o kompilacji i uruchamianiu programu w Javie, słowach kluczowych i istot...(83.85 zł najniższa cena z 30 dni)
77.40 zł
129.00 zł(-40%) -
Jesteś specjalistą IT. I jesteś dobry w tym, co robisz. Masz wiedzę, doświadczenie, chcesz się nimi podzielić z innymi, pomóc im radzić sobie z problemami, które sam już dawno rozwiązałeś, może także zaprezentować się od tej strony przyszłym pracodawcom i zleceniodawcom, tylko... kto - poza Tobą ...
Marka osobista w branży IT. Jak ją zbudować i rozwijać Marka osobista w branży IT. Jak ją zbudować i rozwijać
(32.44 zł najniższa cena z 30 dni)29.94 zł
49.90 zł(-40%) -
MikroTik, łotewska firma z siedzibą w Rydze, od lat produkuje sprzęt sieciowy. Przystępna cena i świetna jakość sprawiły, że urządzenia sygnowane logo MikroTik zdobyły niezwykłą popularność - po produkty łotewskiej marki sięga się coraz częściej. Jeśli planujesz zmodernizować lub zbudować sieć i ...
Konfiguracja usług sieciowych na urządzeniach MikroTik Konfiguracja usług sieciowych na urządzeniach MikroTik
(51.35 zł najniższa cena z 30 dni)47.40 zł
79.00 zł(-40%) -
To drugie, zaktualizowane wydanie przewodnika po systemie Prometheus. Znajdziesz w nim wyczerpujące wprowadzenie do tego oprogramowania, a także wskazówki dotyczące monitorowania aplikacji i infrastruktury, tworzenia wykresów, przekazywania ostrzeżeń, bezpośredniej instrumentacji kodu i pobierani...
Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II
(57.85 zł najniższa cena z 30 dni)53.40 zł
89.00 zł(-40%) -
Dzięki tej książce zrozumiesz bazowe koncepcje programowania funkcyjnego i przekonasz się, że możesz włączać je do kodu bez rezygnacji z paradygmatu obiektowego. Dowiesz się również, kiedy w swojej codziennej pracy i dlaczego używać takich opcjifunkcjonalności, jak niemutowalność i funkcje czyste...
Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego
(56.55 zł najniższa cena z 30 dni)52.20 zł
87.00 zł(-40%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Język R i analiza danych w praktyce. Wydanie II Nina Zumel, John Mount (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.