1. Wprowadzenie
- python
- jupyter
- numpy
- matplotlib
Wszystkie zadania wykonywane są po zalogowaniu na serwerze panda.
- Utwórz katalog nadając mu w nazwie swoje „Imię Nazwisko”. W tym katalogu będziesz przechowywał wszystkie notatniki i pliki z zajęć.
- Utwórz nowy notatnik działający dla języka Python3 o nazie
„01 Wprowadzenie”
. - Nadaj tytuł notatnika
„Wprowadzenie do Data Minig”
- Wyrysuj w notatniku przebieg funkcji sigmoidalnej na odcinku [-5, 5]
$$f(x) = \frac{1}{1+e^{-\alpha x}}$$ - Wyrysuj przebieg kilku funkcji sigmoidalnych ze współczynnikiem nachylenia $\alpha=0.5, 1, 2, 100$
- Wygeneruj tablicę o rozmiarze 10000 zawierającą losowe wartości z rozkładu normalnego i wyrysuj histogram wylosowanych wartości
- Wczytaj do tablicy
numpy
dane liczbowe umieszczone w pliku tekstowymdata/wine.data
.
Format danych: region (1,2,3) , Alcohol, Malic acid, Ash, Alcalinity of ash, Magnesium, Total phenols, Flavanoids, Nonflavanoid phenols, Proanthocyanins, Color intensity, Hue, OD280/OD315 of diluted wines, Proline
1,14.23,1.71,2.43,15.6,127,2.8,3.06,.28,2.29,5.64,1.04,3.92,1065 1,13.2,1.78,2.14,11.2,100,2.65,2.76,.26,1.28,4.38,1.05,3.4,1050 1,13.16,2.36,2.67,18.6,101,2.8,3.24,.3,2.81,5.68,1.03,3.17,1185 ...
- Wyznacz wartości minimalne, maksymalne, średnie i odchylenie standardowe dla wszystkich zmiennych
- Wyrysuj histogram wybranych zmiennych o charakterze ciągłym dala całych całych i osobno dla każdego z 3 regionów
- Wyznacz liczebność win z każdego z 3 regionów, wynik przedstaw graficznie za pomocą odpowiedniego wykresu. Która zmienna wydaje się najlepiej rozróżni ac wina z różnych regionów.
- Wyrysuj wykres rozrzutu dla dwóch wybranych zmiennych. Które 2 zmienne najlepiej separują wina z 2 regionów? Czy istnieją zmienne, które wyglądają na skorelowane?