• python
  • jupyter
  • numpy
  • matplotlib

Wszystkie zadania wykonywane są po zalogowaniu na serwerze panda.

  1. Utwórz katalog nadając mu w nazwie swoje „Imię Nazwisko”. W tym katalogu będziesz przechowywał wszystkie notatniki i pliki z zajęć.
  2. Utwórz nowy notatnik działający dla języka Python3 o nazie „01 Wprowadzenie”.
  3. Nadaj tytuł notatnika „Wprowadzenie do Data Minig”
  4. Wyrysuj w notatniku przebieg funkcji sigmoidalnej na odcinku [-5, 5]
    $$f(x) = \frac{1}{1+e^{-\alpha x}}$$
  5. Wyrysuj przebieg kilku funkcji sigmoidalnych ze współczynnikiem nachylenia $\alpha=0.5, 1, 2, 100$
  6. Wygeneruj tablicę o rozmiarze 10000 zawierającą losowe wartości z rozkładu normalnego i wyrysuj histogram wylosowanych wartości
  7. Wczytaj do tablicy numpy dane liczbowe umieszczone w pliku tekstowym data/wine.data.
    Format danych: region (1,2,3) , Alcohol, Malic acid, Ash, Alcalinity of ash, Magnesium, Total phenols, Flavanoids, Nonflavanoid phenols, Proanthocyanins, Color intensity, Hue, OD280/OD315 of diluted wines, Proline
       1,14.23,1.71,2.43,15.6,127,2.8,3.06,.28,2.29,5.64,1.04,3.92,1065
       1,13.2,1.78,2.14,11.2,100,2.65,2.76,.26,1.28,4.38,1.05,3.4,1050
       1,13.16,2.36,2.67,18.6,101,2.8,3.24,.3,2.81,5.68,1.03,3.17,1185
       ... 
  8. Wyznacz wartości minimalne, maksymalne, średnie i odchylenie standardowe dla wszystkich zmiennych
  9. Wyrysuj histogram wybranych zmiennych o charakterze ciągłym dala całych całych i osobno dla każdego z 3 regionów
  10. Wyznacz liczebność win z każdego z 3 regionów, wynik przedstaw graficznie za pomocą odpowiedniego wykresu. Która zmienna wydaje się najlepiej rozróżni ac wina z różnych regionów.
  11. Wyrysuj wykres rozrzutu dla dwóch wybranych zmiennych. Które 2 zmienne najlepiej separują wina z 2 regionów? Czy istnieją zmienne, które wyglądają na skorelowane?