To jest stara wersja strony!
Reguły asocjacyjne
Reguły asocjacyjne przypominają reguły decyzyjne omawiane na poprzednim wykładzie. Tym razem jednak decyzja (prawa strona implikacji) nie jest z góry określona, tzn. nie wiemy, na którym atrybucie ma się opierać. Jest to przykład nauki bez nauczyciela: algorytm nie ma określonej z góry prawidłowej odpowiedzi, zamiast tego ma opisać wewnętrzne zależności między atrybutami.
Analiza koszykowa
Dane
Mamy dane następujące informacje o transakcjach w jednym z hipermarketów:
Numer paragonu | Kupione produkty |
1000 | Jabłka, Seler, Pieluchy |
2000 | Piwo, Seler, Jajka |
3000 | Jabłka, Piwo, Seler, Piwo |
4000 | Piwo, Jajka |
Zadaniem algorytmu odkrywającego reguły asocjacyjne będzie odpowiedź napytanie: Jakie są zależności pomiędzy kupowanymi produktami?
Pytanie Patrząc na zbiór uczący w tabeli powyżej wypisz reguły które będą określać jakie produkty są kupowane najczęściej razem.
Support i Confidence
Z powyższego zbioru uczącego możemy łatwo wywnioskować następujące reguły:
if Piwo then Jajka
if Jajka then Piwo
if Jabłka then Seler
if Seler then Jabłka
Pozostałe reguły intuicyjnie odrzuciliśmy ponieważ ich częstotliwość w zbiorze uczącym jest niewielka, i w związku z tym mamy małą pewność co do ich prawdziwości.
W celu automatycznego określenia tych parametrów stosuje się dwa wskaźniki: support i confidence
Support
Wskaźnik ten określa częstotliwość (prawdopodobieństwo) danej reguły w stosunku do wszystkich transakcji.
Innymi słowy jest to stosunek ilości transakcji zawierających dane elementy wchodzące w skład reguły do wszystkich transakcji.
Dla przykładu z tabeli powyżej, support reguły
If Piwo then Jajka
jest równy , ponieważ 3 transakcje zawierają Piwo i Jajka, natomiast ilość wszystkich transakcji jest równa 4.
Pytanie Jaki jest support dla reguły
if Jabłka then Seler
?
Confidence
Frequent Itemsets
Apriori
Weka