Laboratorium 12 - Sieci Bayesowskie - wprowadzenie

Ćwiczenia bazujące na materiałach Daphne Koller
Przed zajęciami przejrzyj wykłady:

Wprowadzenie

Laboratorium będzie polegało na wykorzystaniu oprogramowania SAMIAM do zaprojektowania niewielkiej sieci Bayesowskiej pozwalającej na obliczanie zdolności kredytowej.

SAMIAM można pobrać ze strony UCLA. Proszę pobrać wersję „Classic” w przypadku gdy domyślna wersja nie działa.

  • Plik z siecią prawdopodobieństwa zachorowania na mukowiscydozę: pobierz
  • Plik ze szkieletem sieci: pobierz.

Samiam

Podczas konstruowania sieci, będziemy wykorzystywać Edit Mode aby dodać krawędzie do sieci. Aby włączyć Edit Mode, wejdź do Menu→Edit Mode. Jeśli opcja jest szara, oznacza że program już znajduje się w tym trybie.

Aby dodać krawędź do sieci, idź do Edit→Add Edge, a następnie:

  • kliknij na dowolny węzeł, który ma być rodzicem
  • kliknij na węzeł, który ma być dzieckiem

Podczas modyfikowania sieci, pamiętaj żeby nie zmieniać żadnych innych ustawień poza rozkładem prawdopodobieństwa dla danych w węzłach. Aby zmienić prawdopodobieństwa kliknij w zakładkę Probabilities. Pamiętaj aby wyedytować prawdopodobieństwa za każdym razem kiedy dodane zostanie nowe dziecko do węzła.

W dalszej części będziemy korzystać z Query Mode, żeby zobaczyć jak wyglądają prawdopodobieństwa dla poszczególnych przypadków. W celu zmiany trybu na Query Mode idź do Mode→Query Mode. Żeby podejrzeć prawdopodobieństwa, idź do Query→Show monitors→Show All.

Mukowiscydoza

Za ryzyko zachorowania na mukowiscydozę odpowiedzialnych jest pewien gen. Dla uproszczenia założymy, że składa się on jedynie z dwóch alleli, które mogą przyjmować wartości f lub F. Allel F zwiększa ryzyko zachorowania, które można opisać następująco:

  • osoby z genotypem FF mają 80% szans na zachorowanie
  • osoby z genotypem Ff mają 60% szans na zachorowanie
  • osoby z genotypem ff mają 10% szans na zachorowanie

Uruchom program SAMIAM i wczytaj plik cysticFibrosisBayesNet.net

Przejdź w tryb Query Mode a następnie włącz wszystkie monitory Query→Show monitors→Show All.

Zobacz jak zmieniają się prawdopodobieństwa w zależności od tego które ze zmiennych podajemy jako dane.

W szczególności zaobserwuj co dzieje się dla następujących konfiguracji węzłów (czarne węzły oznaczają węzły z zmienną daną). Jak zmienia sie rozkład prawdopodobieństwa, gdy „odkolorujemy” dany węzeł?

Zdolność kredytowa

bank, w celu wyznaczenia zdolności kredytowej, bada następujące dane klienta:

  • przychód (income)
  • majątek (assets)
  • współczynnik przychodu do już posiadanych kredytów/długów (ratio of debts to income)
  • historię transakcji (payment history)
  • wiek (age)
  • wiarygoność klienta (reliability)
  • przyszły dochód (future income)
  • współczynnik długów do przyszłego dochodu (ratio of debts to income)

Zadanie polega na zbudowaniu sieci Bayesowskiej, która na podstawie danych (pewnych, lub wszystkich) udzieli odpowiedzi na temat zdolności kredytowej klienta.

Przy obliczaniu zdolności kredytowej, następujące zależności brane są pod uwagę:

  1. Im lepsza historia transakcji (payment history) tym bardziej prawdopodobne, ze osoba jest wiarygodna (reliable)
  2. Im starsza osoba, tym bardziej prawdopodobne że będzie bardziej wiarygodna (reliable)
  3. Starsze osoby najczęściej mają świetną historię transakcji (payment history)
  4. Osoby z wysokim stosunkiem długów do przychodu (ratio of debts to income) nie mają zbyt często dobrej historii transakcji (payment history)
  5. Im większy jest przychód (income) danej osoby, tym większe prawdopodobieństwo, ze osoba ma duży majątek (assets)
  6. Im większy majątek (assets) danej osoby i im większy jej przychód (income) tym większe prawdopodobieństwo, ze osoba ta będzie miała wysoki przyszły przychód (future income)
  7. Bardziej wiarygodne osoby (reliable) najczęściej maja większą zdolność kredytową. Podobnie osoby z obiecująco wysokim przyszłym dochodem (future income) jak również osoby z niskim stosunkiem długów do przychodu (ratio of debts to income) mają większą zdolność kredytową niż inni.

Aby sprawdzić jak wyglądają prawdopodobieństwa po zbudowaniu sieci, przejdź do Query Mode i przetestuj działanie sieci. Upewnij się, że algorytm wnioskujący (inference algorithm) ustawiony jest na hugin.

pl/dydaktyka/ml/lab12.txt · ostatnio zmienione: 2017/07/17 08:08 (edycja zewnętrzna)
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0