To jest stara wersja strony!
Opis
Krzysztof Morcinek, krzysztof.morcinek@gmail.com
Uczenie maszynowe w RBS, jako metoda rozbudowy/rozszerzania istniejącego systemu o nowe reguły, modyfikacja reguł, przykłady.
Spotkania
080311
080401
080520
-
Zastosowano algorytm ID3, lecz wtedy tworzy sie zbyt wiele gałęzi.
Pójście w stronę C4.5 na początku następuje agregacja (wartości są uporządkowane) i zmiana atrybutów porządkowych na inne o mniejszej ilości możliwych wartości.
080527
Pytania:
Czy jako zbiór uczący może być cała dziedzina, czyli 'dni x godziny x miesiące'?
Czy musimy obsługiwać przekłamane przykłady uczące i braki (brak któregoś atrybutu)?
Testy:
Losowy zbiór uczący składający sie z 150 przykładów
Dziedzina składa się z 2016 przypadków
Najpierw algorytm buduje drzewo z 150 przykładów zbioru uczącego, następnie pozostałe 1866 są testowane w zbudowanym drzewie
080610
Wyniki:
-
-
Wykonano 20 testów
Średnia skuteczność wynosiła 91.2%
Poprawnie sklasyfikowane przykłady testowe wahały się od 1488 do 1866
Wyniki uzyskane ulepszonym algorytmem ID3 są lepsze ponieważ już przed rozpoczęciem budowy drzewa zamieniamy wielowartościowe atrybuty na prostsze (mniejsza ilość wartości). Korzystam ze zbioru uczącego się zawierającego 7,4% przykładów (150 / 2016). Zwykły algorytm ID3 dobrze dopasuje każdy ze 150 przykładów, lecz zabraknie mu ogólności dla przykładów spoza tego zbioru. Agregacja pozwala nam podzielić wartości zbyt licznych atrybutów i przejść na prostsze biorąc pod uwagę przyrost informacji (entropię). Najbardziej pożądane jest tak podzielić wartości aby w danym zbiorze występowała przewaga jednych pojęć docelowych (np jednego, kilku) nad pozostałymi (najlepiej żeby ich nie było).
Projekt
Sprawozdanie
Materiały