Przeczytaj oficjalny opis

Umiejętności

Użyj Pythona, aby kopać zbiory danych i przewidywać wzorce.

Standard produkcji

Twórz modele statystyczne - regresję i klasyfikację - które generują użyteczne informacje z nieprzetworzonych danych.

Wielkie zdjęcie

Opanuj podstawy uczenia maszynowego i wykorzystaj moc danych do prognozowania, co dalej.

Poznaj swój zespół wsparcia

Nasza doskonałość edukacyjna to wysiłek społeczności. Kiedy uczysz się w GA, zawsze możesz polegać na wewnętrznym zespole ekspertów, który zapewnia wskazówki i wsparcie, kiedy tylko tego potrzebujesz.

Instruktorzy

Dowiedz się o branżowych strukturach, narzędziach, słownictwie i najlepszych praktykach nauczyciela, którego codzienna praca wymaga profesjonalnego ich używania.

Asystenci nauczania

Nabieranie nowego materiału nie zawsze jest łatwe. Dzięki godzinom pracy i innym kanałom nasze biura pomocy technicznej służą Państwu pomocą w udzielaniu odpowiedzi, wskazówek i nie tylko.

Wytwórcy kursów

Nasi absolwenci uwielbiają swoich Kursantów, którzy utrzymywali ich motywację podczas całego kursu. W każdej chwili możesz skontaktować się ze swoim wsparciem.

Zobacz, czego się nauczysz

Część 1: Projektowanie badań i eksploracyjna analiza danych

  • Czym jest nauka danych
    • Opisz program kursu i ustal środowisko lekcyjne
    • Odpowiedz na pytania: "Co to jest nauka danych? Jakie role istnieją w Data Science?"
    • Zdefiniuj przepływ pracy, narzędzia i podejścia, których używają naukowcy do analizy danych
  • Projektowanie badań i pandy
  • Zdefiniuj problem i określ odpowiednie zestawy danych, korzystając z obiegu pracy z danymi
  • Omówienie obiegu danych w oparciu o studium przypadku w bibliotece Pandas
  • Importuj, formatuj i czyść dane za pomocą Biblioteki Pand
  • Statystyka Podstawowa I
  • Używaj bibliotek NumPy i Pandy do analizowania zbiorów danych przy użyciu podstawowych statystyk podsumowujących: średnia, mediana, tryb, maks., Min, kwartyl, kwartyl, zakres, wariancja, odchylenie standardowe i korelacja
  • Twórz wizualizacje danych - wykresy rozproszenia, macierz rozproszenia, wykres liniowy, blot box i histogramy - w celu rozpoznania charakterystyk i trendów w zbiorze danych
  • Zidentyfikuj rozkład normalny w zestawie danych, korzystając ze statystyk podsumowania i wizualizacji
  • Statystyka Fundamental II
  • Wyjaśnij różnicę między przyczynowością a korelacją
  • Sprawdź hipotezę w przykładowym studium przypadku
  • Potwierdź swoje odkrycia za pomocą analizy statystycznej (wartości p, przedziały ufności)
  • Wybór instruktora
  • Skoncentruj się na temacie wybranym przez instruktora / klasę, aby zapewnić głębszy wgląd w analizę danych eksploracyjnych

Część 2: Podstawy modelowania danych

  • Wprowadzenie do regresji
    • Zdefiniuj modelowanie danych i regresję liniową
    • Rozróżniać zmienne kategoryczne i ciągłe
    • Zbuduj model regresji liniowej, korzystając z zestawu danych spełniającego założenie liniowości przy użyciu biblioteki naukowej scikit
  • Ocena dopasowania modelu
  • Określ wskaźniki regularyzacji, obciążenia i błędów;
  • Oceń dopasowanie modelu za pomocą funkcji utraty, w tym średniego błędu bezwzględnego, błędu średniej kwadratowej, błędu średniej kwadratowej
  • Wybierz metody regresji na podstawie dopasowania i złożoności
  • Wprowadzenie do klasyfikacji
  • Zdefiniuj model klasyfikacji
  • Zbuduj najbliższego sąsiada K, używając biblioteki naukowej scikit
  • Oceniaj i dostosowuj model, korzystając z takich danych, jak dokładność klasyfikacji / błąd
  • Wprowadzenie do regresji logistycznej
  • Zbuduj model klasyfikacji regresji logistycznej przy użyciu biblioteki naukowej scikit
  • Opisz funkcję sigmoid, kursy i iloraz szans oraz ich związek z regresją logistyczną
  • Oceń model za pomocą wskaźników, takich jak dokładność klasyfikacji / błąd, matryca nieporozumień, krzywe ROC / AOC i funkcje straty
  • Przekazywanie wyników z regresji logistycznej
  • Wyjaśnij kompromis między precyzją a wycofaniem modelu i wyartykułuj koszt fałszywych trafień vs. fałszywych negatywów.
  • Zidentyfikuj elementy zwięzłego, przekonującego raportu i ich związek z konkretnymi odbiorcami / zainteresowanymi stronami
  • Opisz różnicę między wizualizacją dla prezentacji a analizą danych eksploracyjnych
  • Elastyczna sesja klasy
  • Skoncentruj się na temacie wybranym przez instruktora / klasę, aby uzyskać głębszy wgląd w modelowanie danych

Część 3: Nauka o danych w rzeczywistym świecie

  • Drzewa decyzyjne i losowy las
    • Opisz różnice między drzewkami klasyfikacji i regresji oraz interpretuj te modele
    • Wyjaśnij i poinformuj o kompromisach drzew decyzyjnych a modelami regresji
    • Twórz drzewa decyzyjne i losowe lasy za pomocą biblioteki scikit-learn
  • Przetwarzanie języka naturalnego
  • Zademonstruj, jak tokenizować tekst w języku naturalnym za pomocą NLTK
  • Kategoryzuj i oznaczaj niestrukturalne dane tekstowe
  • Wyjaśnij, jak zbudować model klasyfikacji tekstu za pomocą NLTK
  • Redukcja wymiarów
  • Wyjaśnij, jak wykonać redukcję wymiarów za pomocą modeli tematycznych
  • Zademonstruj, jak udoskonalić dane za pomocą ukrytej alokacji dirichletów (LDA)
  • Wyodrębnij informacje z przykładowego zestawu danych tekstowych
  • Praca z danymi z szeregów czasowych
  • Wyjaśnij, dlaczego dane szeregów czasowych różnią się od innych danych i jak je uwzględnić
  • Utwórz środki walcowania i dane dotyczące serii czasowych za pomocą biblioteki Pandas
  • Wykonaj autokorelację na danych szeregów czasowych
  • Tworzenie modeli z danymi szeregu czasowego
  • Dekompozycja danych szeregów czasowych na trend i pozostałe składniki
  • Sprawdzanie poprawności i sprawdzanie poprawności danych z różnych zestawów danych
  • Użyj modelu ARIMA do prognozowania i wykrywania trendów w danych szeregów czasowych
  • Wartość baz danych
  • Opisz przypadki użycia dla różnych rodzajów baz danych
  • Wyjaśnij różnice między relacyjnymi bazami danych i bazami dokumentów
  • Pisz proste zapytania, aby pobierać dane z bazy danych i używać w Pandach
  • Moving Forward z twoją Data Science Career
  • Określ wspólne modele używane w różnych branżach
  • Zidentyfikuj przypadki użycia dla popularnych modeli
  • Przedyskutuj kolejne kroki i dodatkowe zasoby do nauki w zakresie nauki danych
  • Elastyczna sesja klasy
  • Skoncentruj się na temacie wybranym przez instructor/class, aby zapewnić głębszy wgląd w wiedzę o danych w realnym świecie
  • Prezentacje końcowe
  • Przedstaw końcową prezentację rówieśnikom, instruktorowi i panelistom, którzy wskażą mocne strony i obszary do poprawy

Opcje finansowania

Potrzebujesz pomocy płatniczej? Nasze opcje finansowania pozwalają skupić się na swoich celach zamiast na barierach, które powstrzymują Cię przed ich osiągnięciem.

WeLend

Złóż wniosek o nieoprocentowaną pożyczkę do 18 miesięcy lub o stałą pożyczkę do 48 miesięcy.⁵⁵ Musi być obywatelem Hongkongu lub stałym mieszkańcem.
Opcje finansowania różnią się na każdym rynku i są dostępne tylko dla studentów zaakceptowanych w naszych programach.
Skontaktuj się z lokalnym urzędnikiem ds. Rekrutacji, aby uzyskać więcej informacji.

Program prowadzony przez:
Język angielski

Zobacz 12 więcej kursów w General Assembly »

Ten kurs jest Na kampusie
Data początkowa
Duration
10 tygodnie
Zaoczne
Cena
3,950 USD
Wg lokalizacji
Wg daty
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Data początkowa
Termin nadsyłania zgłoszeń
Location
Termin nadsyłania zgłoszeń
Data końcowa
Termin nadsyłania zgłoszeń
Data końcowa
Termin nadsyłania zgłoszeń
Data końcowa
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa
Location
Termin nadsyłania zgłoszeń
Data końcowa