--- pl:dydaktyka:ml:2014lab4 [2014/04/01 20:08]
esimon [Frequent Itemsets]
+++ pl:dydaktyka:ml:2014lab4 [2019/06/27 15:50] (aktualna)
@@ Linia 10: / Linia 10: @@
 |1000 | Jabłka, Seler, Pieluchy |
 |2000 | Piwo, Seler, Jajka |
-|3000 | Jabłka, Piwo, Seler, Piwo |
+|3000 | Jabłka, Jajka, Seler, Piwo |
 |4000 | Piwo, Jajka |
@@ Linia 38: / Linia 38: @@
 **Pytanie** Jaki jest //support// dla reguły poniżej? <code> if Jabłka then Seler </code>
 ===Confidence===
-Wskaźnik ten określa siłę implikacji w regule. Innymi słowy jest on definiowany jako stosunek ilości transakcji zawierających elementy wchodzące w skład reguły do wszystkich transakcji zawierających elementy z części warunkowej reguły.
+Wskaźnik ten określa siłę implikacji w regule. Innymi słowy jest on definiowany jako stosunek ilości transakcji zawierających wszystkie elementy wchodzące w skład reguły do transakcji zawierających elementy z części warunkowej reguły.
 Dla przykładu z tabeli powyżej, //confidence// reguły <code>If Piwo then Jajka </code> jest równy $\frac{3}{3}=100\%$, ponieważ 3 transakcje zawierają Piwo i Jajka, natomiast ilość transakcji zawierających elementy z części warunkowej tej reguły (czyli w tym wypadku Piwo) jest także równa 3.
@@ Linia 67: / Linia 67: @@
   - znajdź pośród wygenerowanych //1-zbiorów//, //częste 1-zbiory// (//frequent 1-itemsets// $L_1$) - czyli takie, których support jest $\geq \epsilon$
   - bazując na $L_1$ wygeneruj //2-zbiory// (//2-itemsets//)
-  - znajdź pośród wygenerowanych //2-zbiorów// częste //2-zbiory// $L_2$
+  - znajdź pośród wygenerowanych //2-zbiorów//, //częste 2-zbiory// $L_2$
   - Powtarzaj proces, do momentu aż ostatni wygenerowany zbiór $L_{k-1}=\o$
@@ Linia 86: / Linia 86: @@
   - Pobierz plik {{:pl:dydaktyka:ml:apriori.m.zip|}} i przyjrzyj się funkcjom które zostały w nim zaimplementowane.
   - Bazując na algorytmie powyżej, zaimplementuj nową funkcję o nagłówku poniżej:  <code>function FrequentKitemsets = apriori(OneItemsets, Transactions)</code>
-  - Wyznacz reguły które mają $confidence \geq 60\%$.
+  - Wyznacz reguły które mają $confidence \geq 60\%$ i $support \geq 50\%$
-  - Dla ułatwienia, poniżej znajduje się rysunek pokazujący jak powinien działać algorytm (**Uwaga** na rysunku przedstawiane są nie wszystkie //k-zbiory częste//).
+  - Dla ułatwienia, poniżej znajduje się rysunek pokazujący jak powinien działać algorytm (**Uwaga** na rysunku nie są przedstawiane wszystkie //k-zbiory częste//).
+  - **Uwaga** Algorytm przedstawiony na rysunku poniżej zawiera pewną optymalizację polegająca na obserwacji, że zbiór 3-elementowy nie może być częsty jeśli zawiera w sobie zbiór dwuelementowy, który nie jest częsty.
 {{:pl:dydaktyka:ml:apriori.png?500|}}

pl/dydaktyka/ml/2014lab4.1396375687.txt.gz · ostatnio zmienione: 2019/06/27 15:54 (edycja zewnętrzna)

Pokaż stronę Poprzednie wersje

Menadżer multimediów Do góry

AIwiki

Menu

Dla Studentów

Old specialized AI courses

SMaDA/SMaIDA/AIDA

Informatyka (EAIiIB)

Studia Dr

Inne materialy dydaktyczne

Archiwum

Dyplomanci

Geist Season of Code

HeKatE

Public

Różnice