To jest stara wersja strony!
Opis
Krzysztof Morcinek, krzysztof.morcinek@gmail.com
Uczenie maszynowe w RBS, jako metoda rozbudowy/rozszerzania istniejącego systemu o nowe reguły, modyfikacja reguł, przykłady.
Spotkania
080311
080401
080520
-
Zastosowano algorytm ID3, lecz wtedy tworzy sie zbyt wiele gałęzi.
Pójście w stronę C4.5 na początku następuje agregacja (wartości są uporządkowane) i zmiana atrybutów porządkowych na inne o mniejszej ilości możliwych wartości.
080527
Pytania:
Czy jako zbiór uczący może być cała dziedzina, czyli 'dni x godziny x miesiące'?
Czy musimy obsługiwać przekłamane przykłady uczące i braki (brak któregoś atrybutu)?
Testy algorytmu ID3
Przykładowe drzewo które nie zostało w pełni wygenerowane ponieważ program graphviz nie poradził sobie. Było to związane z tym, że atrybuty początkowe zawierały zbyt wiele wartości i każda z nich była w każdym wyniku testu opierającego się o ten atrybut. Czasochłonne i pamięciochłonne było też konstruowanie i przechowywanie w pamięci takiego drzewa.
080610
Testy:
Korzystamy z algorytmu ID3 uzupełnionego o występujące w C4.5 agregowanie wartości porządkowych i zmianę atrybutów na prostsze
Losowy zbiór uczący składający sie z 150 przykładów
Dziedzina składa się z 2016 przypadków
Najpierw algorytm buduje drzewo z 150 przykładów zbioru uczącego, następnie pozostałe 1866 są testowane w zbudowanym drzewie
Wyniki:
-
-
Wykonano 20 testów
Średnia skuteczność wynosiła 86.3%
Poprawnie sklasyfikowane przykłady testowe wahały się od 1329 do 1776
Wyniki uzyskane ulepszonym algorytmem ID3 są lepsze ponieważ już przed rozpoczęciem budowy drzewa zamieniamy wielowartościowe atrybuty na prostsze (mniejsza ilość wartości). Korzystam ze zbioru uczącego się zawierającego 7,4% przykładów (150 / 2016). Zwykły algorytm ID3 dobrze dopasuje każdy ze 150 przykładów, lecz zabraknie mu ogólności dla przykładów spoza tego zbioru.
Projekt
Sprawozdanie
Materiały