Pokaż źródło strony

Ostatnie zmiany Indeks

AIwiki

Strona Główna

Dla Studentów

Zima / Winter 2021:

Computer Science: Introduction to AI
ISI: Podstawy Sztucznej Inteligencji

Old specialized AI courses

SMaDA/SMaIDA/AIDA

1. semester:

2. semester:

WSHOP -- Development Workshop

Informatyka (EAIiIB)

1. rok:

2. i 3. rok:

4. rok:

Systemy i technologie wirtualizacji

Studia Dr

HeKatE

Public

The KESE workshop (EN only)
Mindstorms (archive)

en
hekate
hekatedev
kese
mindstorms
misc
pl
- dydaktyka
  - ai
  - aml
  - asd
  - bim
  - cp
  - csp
  - dss
  - est
  - games
  - ggp
  - jimp2
  - jsi
  - krr
  - labcode316
  - logic
  - mbn
  - mgr
  - miw
  - ml
    - prv
    - 2014lab3
    - 2014lab4
    - 2016lab6
    - 2018lab1
    - 2018lab2
    - 2018lab3
    - 2018lab4
    - 2018lab5
    - 2018lab6
    - 2018lab7
    - 2018lab8
    - 2018lab9
    - 2018lab10
    - lab1
    - lab2
    - lab3
    - lab4
    - lab5
    - lab6
    - lab8
    - lab9
    - lab10
    - lab11
    - lab12
    - lab13
    - mlrep1
    - mlrep2
    - mlrep3
    - start
    - start2013
    - start2014
    - start2015
    - start2016
  - pf
  - piw
  - planning
  - pp
  - psi
  - rules
  - sbd
  - semweb
  - sitw
  - so
  - unix
  - wdk
  - wshop
  - ztb
  - jsi2007
  - jsi2008
  - jsi2009
  - piw2008
  - start
- epp
- hekate
- hekatedev
- hexor
- mindstorms
- misc
- miw
- plnxt
- prolog
- wiki
- hexor
- mindstorms2
- miw
- start
- studentsidebar
playground
research
student
wiki
sidebar
sidebarold
start
tmp

To jest stara wersja strony!

Spis treści

Laboratorium 6 - Sztuczne sieci neuronowe

Laboratorium 6 - Sztuczne sieci neuronowe

Ćwiczenia bazujące na materiałach Andrew Ng.
Przed zajęciami przejrzyj wykłady VIII i IX
Instructions in English.

Ćwiczenia do pobrania (files to download): Sieci Neuronowe

Lista i opis plików

ex4.m - Skrypt pomagający przejść przez laboratorium
ex4data1.mat - Dane uczące zawierające pismo odręczne
ex4weights.mat - Parametry sieci neuronowej
displayData.m - funkcja wizualizująca zbiór danych
fmincg.m - Funkcja wyznaczająca minimum (podobna do fminunc)
sigmoid.m - funkcja sigmoidalna
computeNumericalGradient.m - Numerycznie oblicza gradienty
checkNNGradients.m - Funkcja sprawdzajaca gradienty
debugInitializeWeights.m - Funkcja inicjalizujaca wagi początkowe
predict.m - Funkcja predykcji dla sieci neuronowej
sigmoidGradient.m - Obliczanie gradientów dla funkcji sigmoidalnej
randInitializeWeights.m - Losowa inicjalizacja wag sieci neuronowej
nnCostFunction.m - funkcja kosztu dla sieci neuronowej

Wstęp

Celem ćwiczeń laboratoryjnych jest nauczenie sieci neuronowej rozpoznawania cyfr. Sieć neuronowa będzie składać się z 3 warstw. Ilość neuronów w warstwie wyjściowej będzie równa ilości klasyfikowanych wzorców (czyli w naszym przypadku 10).

Struktura sieci neuronowej przedstawiona jest na rysunku poniżej. Pierwsza warstwa zawiera 400 perceptronów, warstwa ukryta zabiera 25 neuronów, a warstwa wyjściowa 10.

Funkcja kosztu

Uzupełnij plik nnCostFunction.m wyznaczając koszt i gradient dla sieci neuronowej.

Uwaga Macierz X, zawierająca zbiór uczący, zbudowana jest w taki sposób, że poszczególne elementy uczące znajdują się w wierszach. Aby dostać się do i-tego przykładu uczącego należy zatem odwołać się do niego w następujący sposób: X(i,:).

Uwaga Macierz X nie zawiera elementów biasu, dlatego w funkcji nnCostFunction.m konieczne jest dodanie tych elementów!

Uwaga Parametry $\Theta$ dla poszczególnych warstw sieci znajdują się w zmiennych Theta1 oraz Theta2. Theta1 ma rozmiar 25 x 401. Theta2 ma rozmiar 10 x 26.

Wartość funkcji kosztu obliczany jest za pomocą wzoru:

$J(\theta)= \frac{1}{m}\sum_{i=1}^{m}\sum_{k=1}^{K}\left [ -y_k^{(i)}log((h_\theta(x^{(i)}))_k)-(1-u_k^{(i)})log(1-(h_\theta(x^{(i)}))_k \right ]$

Gdzie $m$ to ilość przykładów w zbiorze uczącym, a $K$ to ilość etykiet (w naszym przypadku 10).

Uwaga Pamiętaj aby poprawnie obliczyć wartość $h(x)$ , która w przypadku sieci neuronowej polega na wymnożeniu współczynników wag Theta i danych wejściowych - zobacz rysunek powyżej.

Uwaga Sieć neuronowa ma 10 neuronów w warstwie wyjściowej. Zatem wyjście sieci oznaczające, że rozpoznano np liczbę 3, będzie wyglądać następująco:

$y = \begin{bmatrix} 0\\ 0\\ 0\\ 1\\ ...\\ 0 \end{bmatrix}$

Sprawdź działanie funkcji za pomocą skrypty check.m. Uruchom skrypt ex4.m. Powinieneś zobaczyć koszt równy około 0.287629.

Funkcja kosztu z regularyzacją

Wartość funkcji kosztu obliczany jest za pomocą wzoru:

$J(\theta)= \frac{1}{m}\sum_{i=1}^{m}\sum_{k=1}^{K}\left [ -y_k^{(i)}log((h_\theta(x^{(i)}))_k)-(1-u_k^{(i)})log(1-(h_\theta(x^{(i)}))_k \right ] + R(\theta)$

Gdzie

$R(\theta) = \frac{\lambda}{2m}\left [ \sum_{j=1}^{25}\sum_{k=1}^{400}(\Theta_{j,k}^{(1)})^2+\sum_{j=1}^{10}\sum_{k=1}^{25}(\Theta_{j,k}^{(2)})^2 \right ]$

Uwaga Pamiętaj, żeby we wzorze na remaskularyzację nie uwzględniać biasu.

Przetestuj działanie funkcji za pomocą skryptu check.m. Przetestuj działanie funkcji za pomocą skryptu ex4.m. Powinieneś otrzymać wynik funkcji kosztu na poziomie około 0.383770.

Backpropagation

Dla każdego elementu t ze zbioru uczącego wykonaj następujące kroki (tutaj nie da się uniknąć pętli for t=1:m … end).

Ustaw wartości perceptronów (warstwa wejściowa $a^{(1)})$ na t-ty element ze zbioru uczącego $x^{(t)}$ . Wykonaj propagacje wprzód (patrz rysunek pierwszy), obliczając poszczególne wartości dla warstw wewnętrznych ( $z^{(2)}, a^{(2)},z^{(3)},a^{3)}$ ). Pamiętaj o uwzględnieniu biasu w zmiennych $a^{(1)}$ oraz $a^{(2)}$ . Np. a_1 = [1; a_1].
Dla każdego neuronu z warstwy wyjściowej oblicz
$\delta_k^{(3)} = (a_k^{(3)}-y_k)$
Dla ukrytej warstwy $l = 2$ , ustaw:
$\delta^{(2)}=(\Theta^{(2)})^T\delta^{(3)}.*g'(z^{(2)})$
Oblicz zakumulowany gradient dla danego elementu t. Pamiętaj żeby pominąć $\delta_0^{(2)}$ :
$\Delta^{(l)} = \Delta^{(l)} + \delta^{(l+1)}(a^{(l)})^T$
Wyznacz niezregularyzowany gradient:
$\frac{\partial}{\partial\Theta_{i,j}^{(l)})}J(\Theta) = \frac{1}{m}\Delta_{ij}^{(l)}$