Both sides previous revision
Poprzednia wersja
Nowa wersja
|
Poprzednia wersja
|
pl:dydaktyka:ml:2014lab4 [2014/04/01 20:08] esimon [Frequent Itemsets] |
pl:dydaktyka:ml:2014lab4 [2019/06/27 15:50] (aktualna) |
|1000 | Jabłka, Seler, Pieluchy | | |1000 | Jabłka, Seler, Pieluchy | |
|2000 | Piwo, Seler, Jajka | | |2000 | Piwo, Seler, Jajka | |
|3000 | Jabłka, Piwo, Seler, Piwo | | |3000 | Jabłka, Jajka, Seler, Piwo | |
|4000 | Piwo, Jajka | | |4000 | Piwo, Jajka | |
| |
**Pytanie** Jaki jest //support// dla reguły poniżej? <code> if Jabłka then Seler </code> | **Pytanie** Jaki jest //support// dla reguły poniżej? <code> if Jabłka then Seler </code> |
===Confidence=== | ===Confidence=== |
Wskaźnik ten określa siłę implikacji w regule. Innymi słowy jest on definiowany jako stosunek ilości transakcji zawierających elementy wchodzące w skład reguły do wszystkich transakcji zawierających elementy z części warunkowej reguły. | Wskaźnik ten określa siłę implikacji w regule. Innymi słowy jest on definiowany jako stosunek ilości transakcji zawierających wszystkie elementy wchodzące w skład reguły do transakcji zawierających elementy z części warunkowej reguły. |
| |
Dla przykładu z tabeli powyżej, //confidence// reguły <code>If Piwo then Jajka </code> jest równy $\frac{3}{3}=100\%$, ponieważ 3 transakcje zawierają Piwo i Jajka, natomiast ilość transakcji zawierających elementy z części warunkowej tej reguły (czyli w tym wypadku Piwo) jest także równa 3. | Dla przykładu z tabeli powyżej, //confidence// reguły <code>If Piwo then Jajka </code> jest równy $\frac{3}{3}=100\%$, ponieważ 3 transakcje zawierają Piwo i Jajka, natomiast ilość transakcji zawierających elementy z części warunkowej tej reguły (czyli w tym wypadku Piwo) jest także równa 3. |
- znajdź pośród wygenerowanych //1-zbiorów//, //częste 1-zbiory// (//frequent 1-itemsets// $L_1$) - czyli takie, których support jest $\geq \epsilon$ | - znajdź pośród wygenerowanych //1-zbiorów//, //częste 1-zbiory// (//frequent 1-itemsets// $L_1$) - czyli takie, których support jest $\geq \epsilon$ |
- bazując na $L_1$ wygeneruj //2-zbiory// (//2-itemsets//) | - bazując na $L_1$ wygeneruj //2-zbiory// (//2-itemsets//) |
- znajdź pośród wygenerowanych //2-zbiorów// częste //2-zbiory// $L_2$ | - znajdź pośród wygenerowanych //2-zbiorów//, //częste 2-zbiory// $L_2$ |
- Powtarzaj proces, do momentu aż ostatni wygenerowany zbiór $L_{k-1}=\o$ | - Powtarzaj proces, do momentu aż ostatni wygenerowany zbiór $L_{k-1}=\o$ |
| |
- Pobierz plik {{:pl:dydaktyka:ml:apriori.m.zip|}} i przyjrzyj się funkcjom które zostały w nim zaimplementowane. | - Pobierz plik {{:pl:dydaktyka:ml:apriori.m.zip|}} i przyjrzyj się funkcjom które zostały w nim zaimplementowane. |
- Bazując na algorytmie powyżej, zaimplementuj nową funkcję o nagłówku poniżej: <code>function FrequentKitemsets = apriori(OneItemsets, Transactions)</code> | - Bazując na algorytmie powyżej, zaimplementuj nową funkcję o nagłówku poniżej: <code>function FrequentKitemsets = apriori(OneItemsets, Transactions)</code> |
- Wyznacz reguły które mają $confidence \geq 60\%$. | - Wyznacz reguły które mają $confidence \geq 60\%$ i $support \geq 50\%$ |
- Dla ułatwienia, poniżej znajduje się rysunek pokazujący jak powinien działać algorytm (**Uwaga** na rysunku przedstawiane są nie wszystkie //k-zbiory częste//). | - Dla ułatwienia, poniżej znajduje się rysunek pokazujący jak powinien działać algorytm (**Uwaga** na rysunku nie są przedstawiane wszystkie //k-zbiory częste//). |
| - **Uwaga** Algorytm przedstawiony na rysunku poniżej zawiera pewną optymalizację polegająca na obserwacji, że zbiór 3-elementowy nie może być częsty jeśli zawiera w sobie zbiór dwuelementowy, który nie jest częsty. |
| |
{{:pl:dydaktyka:ml:apriori.png?500|}} | {{:pl:dydaktyka:ml:apriori.png?500|}} |