Różnice

Różnice między wybraną wersją a wersją aktualną.

Odnośnik do tego porównania

Both sides previous revision Poprzednia wersja
Nowa wersja
Poprzednia wersja
pl:dydaktyka:ml:2014lab3 [2014/03/26 07:52]
esimon [Przykład drzewa decyzyjnego]
pl:dydaktyka:ml:2014lab3 [2019/06/27 15:50] (aktualna)
Linia 62: Linia 62:
 </​code>​ </​code>​
  
-**Pytanie** Korzystając ze zbioru danych z tabeli z poprzedniej sekcji, policz entropię i przyrost wiedzy dla poszczególnych atrybutów.  ​+**Pytanie** Korzystając ze zbioru danych z tabeli z poprzedniej sekcji, policz entropię i przyrost wiedzy dla poszczególnych atrybutów.  ​**Uwaga** - w przykładzie mamy do czynienia z problemem binarnym, więc sumy ze wzorów tak naprawdę będą tylko dwuelementowe (poza liczeniem //​information gain// dla atrubutu //sky//).
   * Dla którego z atrybutów entropia jest największa?​   * Dla którego z atrybutów entropia jest największa?​
   * Dla którego z atrybutów //​information gain// jest największy?​   * Dla którego z atrybutów //​information gain// jest największy?​
Linia 70: Linia 70:
 ===== Wprowadzenie do Weki ===== ===== Wprowadzenie do Weki =====
 [[http://​www.cs.waikato.ac.nz/​~ml/​weka/​|Weka]],​ to narzędzie opensource do data miningu. [[http://​www.cs.waikato.ac.nz/​~ml/​weka/​|Weka]],​ to narzędzie opensource do data miningu.
-Uruchom je wykonując w konsoli polecenie ​+Uruchom je wykonując w konsoli polecenie. Jeśli program nie jest zainstalowany,​ ściagnij go ze strony ​
 <​code>​ <​code>​
 $ weka  $ weka 
 +</​code>​
 +
 +Jeśli program nie jest zainstalowany,​ ściągnij go ze strony: ​ [[http://​www.cs.waikato.ac.nz/​~ml/​weka/​|Weka]] i uruchom:
 +<​code>​
 +$ java -jar weka.jar
 </​code>​ </​code>​
  
Linia 97: Linia 102:
  
 ==== Poprawność klasyfikacji ==== ==== Poprawność klasyfikacji ====
-  - Załaduj plik credit-g.arff do Weki. Zawiera on dane uczące dla systemu, który na podstawie atrybutów zawartych w pliku powinien określać czy dany zestaw wartości atrybutów wskazuje na wiarygodnego klienta banku, czy też nie - czy można przyznać mu kredyt, czy jest to ryzykowne.+  - Załaduj plik {{:​pl:​dydaktyka:​ml:​credit-g.arff.gz|credit-g.arff}} ​do Weki. Zawiera on dane uczące dla systemu, który na podstawie atrybutów zawartych w pliku powinien określać czy dany zestaw wartości atrybutów wskazuje na wiarygodnego klienta banku, czy też nie - czy można przyznać mu kredyt, czy jest to ryzykowne.
   - Przejdź do zakładki **Classify** i wybierz algorytm J48.   - Przejdź do zakładki **Classify** i wybierz algorytm J48.
   - W obszarze //Test options// wybierz opcje //​Percentage split// z wartością 66% Oznacza to, ze 66% danych posłuży do uczenia, a 34% do walidacji. Jakie to ma znaczenie?   - W obszarze //Test options// wybierz opcje //​Percentage split// z wartością 66% Oznacza to, ze 66% danych posłuży do uczenia, a 34% do walidacji. Jakie to ma znaczenie?
pl/dydaktyka/ml/2014lab3.1395816740.txt.gz · ostatnio zmienione: 2019/06/27 15:54 (edycja zewnętrzna)
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0