Pokaż źródło strony

Ostatnie zmiany Indeks

AIwiki

Strona Główna

Dla Studentów

Zima / Winter 2021:

Computer Science: Introduction to AI
ISI: Podstawy Sztucznej Inteligencji

Old specialized AI courses

SMaDA/SMaIDA/AIDA

1. semester:

2. semester:

WSHOP -- Development Workshop

Informatyka (EAIiIB)

1. rok:

2. i 3. rok:

4. rok:

Systemy i technologie wirtualizacji

Studia Dr

HeKatE

Public

The KESE workshop (EN only)
Mindstorms (archive)

en
hekate
hekatedev
kese
mindstorms
misc
pl
- dydaktyka
  - ai
  - aml
  - asd
  - bim
  - cp
  - csp
  - dss
  - est
  - games
  - ggp
  - jimp2
  - jsi
  - krr
  - labcode316
  - logic
  - mbn
  - mgr
  - miw
  - ml
    - prv
    - 2014lab3
    - 2014lab4
    - 2016lab6
    - 2018lab1
    - 2018lab2
    - 2018lab3
    - 2018lab4
    - 2018lab5
    - 2018lab6
    - 2018lab7
    - 2018lab8
    - 2018lab9
    - 2018lab10
    - lab1
    - lab2
    - lab3
    - lab4
    - lab5
    - lab6
    - lab8
    - lab9
    - lab10
    - lab11
    - lab12
    - lab13
    - mlrep1
    - mlrep2
    - mlrep3
    - start
    - start2013
    - start2014
    - start2015
    - start2016
  - pf
  - piw
  - planning
  - pp
  - psi
  - rules
  - sbd
  - semweb
  - sitw
  - so
  - unix
  - wdk
  - wshop
  - ztb
  - jsi2007
  - jsi2008
  - jsi2009
  - piw2008
  - start
- epp
- hekate
- hekatedev
- hexor
- mindstorms
- misc
- miw
- plnxt
- prolog
- wiki
- hexor
- mindstorms2
- miw
- start
- studentsidebar
playground
research
student
wiki
sidebar
sidebarold
start
tmp

To jest stara wersja strony!

Spis treści

Laboratorium 3 - Concept Learning

Laboratorium 3 - Concept Learning

Literatura: Tom M. Mitchell, Machine Learning, Rozdział 2.

Lista i opis plików

Zbiór danych

Załóżmy, że mamy następujący zbiór danych:

Sky	AirTemp	Humidity	Wind	Water	Forecast	Enjoy
Sunny	Warm	Normal	Strong	Warm	Same	Yes
Sunny	Warm	High	Strong	Warm	Same	Yes
Rainy	Cold	High	Strong	Warm	Change	No
Sunny	Warm	High	Strong	Cool	Change	Yes

Opisuje on dni ocenione przez pływaka pod względem tego czy sprzyjamy one treningowi, czy nie. Pierwsze cztery kolumny zawierają dane na temat poszczególnych parametrów pogodowych dnia, natomiast kolumna EnjoySport przechowuje ocenę pływaka.

Każdy z parametrów może przyjmować następujące wartości, które w Octave zapiszemy za pomocą liczb:

Sky = [1,2,3];      %['Sunny','Rainy','Cloudy'];
AirTemp = [1,2];    %['Warm','Cold'];
Humidity =[1,2];    %['Normal','High'];
Wind = [1,2];       %['Strong','Weak'];
Water = [1,2];      %['Warm','Cool'];
Forecast =[1,2];    %['Same','Change'];
Enjoy = [0,1];      %['No','Yes'];

Analogicznie, zbiór danych treningowych będzie zatem wyglądał tak:

%Sky, AirTemp, Humidity, Wind, Water, Forecast
X = [1,1,1,1,1,1;
    1,1,2,1,1,1;
    2,2,2,1,1,2;
    1,1,2,1,2,2]
%Enjoy
C = [1;1;0;1];

Uwaga Ostatnią kolumnę tabeli (Enjoy) przechowujemy w osobnej macierzy C.

Hipoteza

Zakładamy, że dla każdego atrybutu funkcja hipotezy $h$ będzie opisana za pomocą

$0$ - oznaczającego, że żadna wartość nie jest akceptowana
$Inf$ - oznaczającego, że każda wartość jest akceptowalna dla tego atrybutu (ekwiwalen $?$ z Mitchela)
konkretnej wartości danego atrybutu np. Warm, wskazując że tylko ta wartość jest akceptowalna dla tego atrybutu.

Na przykład hipoteza opisująca sytuację, ze pływak uważa jedynie zimne dni z dużą wilgotnością (AirTemp = Cold,Humidity = High) za odpowiednie do treningu wyglądałaby następująco:

h = [Inf,2,2,Inf,Inf,Inf]

Find-S

Zaimplementuj algorytm Find-S, w pliku findS.m. Algorytm wygląda następująco:

Initialize $h$ to the most specific hypothesis in $H$
For each positive training instance $x$
1. For each attribute constraint $a_i$ in $h$
  1. If the constraint $a_i$ is satisfied by $x$ , then do nothing
  2. Else replace $a_i$ in $h$ by the next more general constraint that is satisfied by $x$
Return $h$

Uwaga Zwróć uwagę, że the most specific hypothesis in H to w przypadku naszej notacji: h=[0,0,0,0,0,0]; Wykorzystaj funkcję zeros, tak aby algorytm działał dla innych danych wejściowych (o innych wymiarach).

Przetestuj działanie za pomocą skryptu ex1.m
Sprawdź poprawność działania algorytmu skryptem check.m

List-Then-Eliminate

Jednym z ograniczeń algorytm Find-S jest to, że podaje on wyłącznie jedno rozwiązanie, podczas gdy hipotez, które są prawdziwe dla naszego zbioru uczącego $D$ jest więcej. Te hipotezy określa się mianem tzw. version-spaces. Definiujemy ją następująco:

$VS_{H,D} = {h \in H | Consistent(h,D)}$

To że funkcja jest zgodna ze zbiorem uczącym (consistent) oznacza, że:

$Consistent(h,D) = (\forall<x,c(x)> \in D) h(x) = c(x)$

Consistent

Zaimplementuj funkcję consistent w pliku consistent.m

Przetestuj jej działanie za pomocą check.m

ListAllHypothesis

Zaimplementuj funkcję listAllHypothesis w pliku listAllHypothesis.m

Przetestuj jej działanie za pomocą check.m

Zastanów się Jaki rozmiar będzie miała przestrzeń wszystkich hipotez dla naszego przykładu?

LearnThenEliminate

Zaimplementuj w pliku learnThenEliminate.m algorytm wyszukujący version-space dla naszego zbioru uczącego.

Algorytm można opisać następująco:

List all possible hypotheses based on attribute domains and assign it to $H$
Remove from $H$ all hypotheses that are not consistant with $D$ , where $D$ is a training set
Output the list of hypotheses

Przetestuj jego działanie za pomocą skryptu ex1.m oraz check.m.

Candidate-Elimination

pl/dydaktyka/ml/lab2.1361365742.txt.gz · ostatnio zmienione: 2019/06/27 15:54 (edycja zewnętrzna)

Pokaż źródło strony Poprzednie wersje

Menadżer multimediów Do góry