--- pl:dydaktyka:planning:intro [2016/04/06 02:03]
msl [Świat klocków]
+++ pl:dydaktyka:planning:intro [2019/06/27 15:50] (aktualna)
@@ Linia 12: / Linia 12: @@
 ===== Świat klocków =====
-{{ :pl:dydaktyka:ai:2015:labs:blokken.png?direct&300|Przykładowy problem ze świata bloków.}} Starym i lubianym problemem klasycznego planowania jest tzw. [[https://en.wikipedia.org/wiki/Blocks_world|świat klocków]]. Problem jest pozornie mało ambitny: polega na znalezieniu odpowiedniej sekwencji ruchów, pozwalających na przestawienie klocków ze stanu początkowego do zadanego stanu końcowego. W świecie klocków istnieje określona liczba klocków (tradycyjnie każdy klocek wyróżnia narysowana na nim literka) oraz kilka kolumn, w których te klocki mogą leżeć. Każdy klocek leży na dnie jednej z kolumn (czyli na stole) lub umieszczony jest na innym klocku. Przykładowe stany początkowy i końcowy pokazane są na obrazie powyżej. Jedyną możliwą akcją w świecie klocków jest podniesienie klocka, który jest na szczycie jakiejś kolumny i położenie go na szczycie dowolnej kolumny.
+{{ :pl:dydaktyka:ai:2015:labs:blokken.png?direct&300|Przykładowy problem ze świata bloków.}} Starym i lubianym problemem klasycznego planowania jest tzw. [[https://en.wikipedia.org/wiki/Blocks_world|świat klocków]]. Problem jest pozornie mało ambitny: polega na znalezieniu odpowiedniej sekwencji ruchów, pozwalających na przestawienie klocków ze stanu początkowego do zadanego stanu końcowego. W świecie klocków istnieje określona liczba klocków (tradycyjnie każdy klocek wyróżnia narysowana na nim literka) oraz kilka kolumn, w których te klocki mogą leżeć. Każdy klocek leży na dnie jednej z kolumn (czyli na stole) lub umieszczony jest na innym klocku. Przykładowe stany początkowy i końcowy pokazane są na obrazie powyżej. Istnieje dwie możliwe akcje w świecie klocków:
+  - podniesienie klocka przez robota. Warunkiem wykonania tej akcji jest swobodny dostęp do klocka (nie może być przykryty innym klockiem) oraz puste ramię robota --- równocześnie może być podniesiony tylko jeden klocek.
+  - położenie klocka przez robota. Warunkiem wykonania tej akcji jest swobodny niepuste ramię robota. Klocek może być położony jedynie na szczycie kolumny.
+==== Rozwiązywanie problemu ====
+Istnieją trzy względnie proste metody rozwiązywania tego problemu:
+=== A-star ===
+Standardową reprezentacją problemów planowania jest skierowany graf nazywany **przestrzenią stanów** --- każdy węzeł w grafie odpowiada możliwemu stanowi świata. Dwa wierzchołki są połączone krawędzią, jeśli istnieje akcja, która pozwala na przejście z jednego stanu do drugiego. Problem planowania sprowadza się wtedy do znalezienia ścieżki łączącej wybrany wierzchołek (stan początkowy) z innym wierzchołkiem (stanem końcowym). Problem jest często ogromny (potencjalnie nieskończony) rozmiar przestrzeni stanów i brak oczywistych metod jej przeszukiwania. Poniżej pokazany jest przykład przestrzeni stanów dla bardzo prostej instancji problemu świata klocków:
+{{ :pl:dydaktyka:planning:blocks_world_state_space.png?300 |Przykładowa przestrzeń stanów w świecie klocków}}
+Podstawową metodą przeszukiwania przestrzeni stanów jest zastosowanie heurystycznych algorytmów, np. [[https://en.wikipedia.org/wiki/A*_search_algorithm|A-star]]. Problemem tego podejścia jest zależność od heurystyki, która musi być [[https://en.wikipedia.org/wiki/Admissible_heuristic|dopuszczalna]] i nie przenosi się łatwo do innych problemów tego typu. Z drugiej strony jednak to właśnie dobrze dobrana heurystyka często sprawia, że problem daje rozwiązać się w rozsądnym czasie (dlatego też aktualnie jest wkładane dużo wysiłku w automatyczne odkrywanie heurystyk).
+== Zadania ==
+  - proszę zdefiniować dopuszczalną heurystykę dla problemu świata klocków
+=== Kodowanie do problemu satysfakcji ograniczeń ===
+Często stosowanym podejściem w problemach posiadających rozbudowaną strukturę jest przetłumaczenie problemu planowania do problemu satysfakcji ograniczeń i zastosowanie istniejącego solvera. Takie tłumaczenie wiąże się jednak z pewnymi trudnościami:
+  - w problemach satysfakcji ograniczeń istnieje jeden globalny stan (aktualne wartości zmiennych). Aby modelować systemy stanowe, należy najczęściej zdefiniować po jednej kopii wszystkich zmiennych stanowych dla każdej chwili czasowej problemu. Następnie ograniczeniami wymusza się, aby następujące po sobie stany spełniały odpowiednie warunki.
+  - problem planowania może nie zakładać żadnego horyzontu czasowego ("deadline'u"), podczas, gdy w problemach dyskretnych nie mogą istnieć zmienne o nieskończonej dziedzinie. W horyzont czasowy reprezentuje się wtedy jako skończoną (dostatecznie dużą) wartość. Aby konstruować jak najkrótsze plany często wymusza się na solverze, by najpierw próbował przypisywać horyzontowi czasowemu jak najmniejsze wartości.
+== Zadania ==
+  - proszę pobrać {{:pl:dydaktyka:planning:blocks_world_minizinc.zip|model świata klocków napisany w MiniZincu}}:
+      - świat bloków opisany w tym modelu jest uproszczoną wersją problemu opisanego powyżej. Na czym polegają wprowadzone uproszczenia?
+      - które ograniczenia definiuje sposób przechodzenia między stanami?
+      - proszę teraz:
+           - zwiększyć wartość maksymalnej liczby kroków do odpowiednio dużej wartości - jaki ma to wpływ na długość planu?
+           - zmienić definicję ostatniego kroku (parametr ''end'') tak, aby był on zmienną o odpowiedniej dziedzinie
+           - zmienić definicję ograniczenia definiującego przejścia między stanami tak, aby przejście te następowały jedynie, gdy indeks czasowy stanu nie przekracza wartości nowej zmiennej ''end''
+           - zmienić adnotację przy definicji celu tak, aby solver starał się zaczynać zawsze od jak najmniejszej wartości zmiennej ''end''
+           - proszę poprawić wypisywanie wyniku tak, aby wypisywało tylko istotne stany
+=== Program planujący ===
+Innym rozwiązaniem jest zastosowania generycznego programu planującego, który przyjmując na wejściu definicję problemu, będzie w stanie znaleźć dopuszczalny plan. Jednym z najbardziej znanych programów planujących jest powstały na Stanfordzie w latach 70 program STRIPS. Używana w nim reprezentacja wiedzy jest do dzisiaj podstawą większości narzędzi planujących. Przykładowa struktura problemu może być zdefiniowana następująco:
+  * na stan składa się lista zachodzących w nim faktów
+  * akcja jest zdefiniowana jako czwórka:
+    - nazwa akcji plus jej argumenty
+    - warunki: lista faktów, które muszą zachodzić, aby akcja była wykonalna
+    - fakty dodawane: lista faktów, które stają się prawdziwe po wykonaniu akcji
+    - fakty usuwane: lista faktów, które przestają być prawdziwe po wykonaniu akcji
+Mając taką reprezentację wiedzy, klasyczny program planujący działa według bardzo prostego wzorca (dla zadanego stanu końcowego G i początkowego S):
+  - Sprawdź, czy aktualny stan jest stanem końcowym. Jeżeli tak, wypisz znaleziony plan.
+  - Znajdź fakt F, który jest prawdziwy w stanie końcowym, ale nie jest prawdziwy aktualnym stanie.
+  - Znajdź akcję A, która posiada w liście faktów dodawanych fakt F.
+  - Uruchom rekurencyjnie rutynę planującą, aby znaleźć plan doprowadzający do stanu, który spełnia warunki wykonania akcji A.
+  - Wykonaj akcję A i zaktualizuj aktualny stan do stanu S'.
+  - Uruchom rutynę planującą zaczynając od nowego stanu S'.
+Efektem powyższej procedury będzie "odwrócony plan", aby miał sens, należy go wypisać idąc od końca. Drugi haczyk polega na unikaniu zapętlenia w planowaniu - jeżeli chcemy osiągnąć warunki wykonania akcji A (punt 4.) należy wyłączyć ją z procesu planowania.
+== Zadania ==
+  - Należy pobrać {{:pl:dydaktyka:planning:blocks_world_strips.pl|kod programu planującego}} i otworzyć go w edytorze tekstu lub [[http://swish.swi-prolog.org/|wygodnym środowisku on-line]]. W miarę możliwości (i znajomości prologa) proszę zapoznać się z implementacją plannera STRIPS na końcu pliku. Następnie należy uzupełnić go o informacje potrzebne do rozwiązania problemu bloków (sekcje ''%TODO:''). Objaśnienia:
+    - dla wygody planowania możemy pominąć numery kolumn, a stan może być reprezentowane przez pięć typów faktów (przykładowe stany można zobaczyć w sekcji ''EXAMPLES OF USAGE''):
+      - ''ontable/1'' --- dany klocek leży na stole, np. ''ontable(a)''
+      - ''on/2'' --- dany klocek leży na drugim klocku, np. ''on(a,b)''
+      - ''clear/1'' --- na danym klocku nic nie leży, np. ''clear(a)''
+      - ''holding/1'' --- dany klocek został właśnie podniesiony, np. ''holding(a)''
+      - ''handempty/0'' --- żaden klocek nie jest aktualnie podniesiony, czyli: ''handempty''
+    - potrzebne są cztery rodzaje akcji (jedna z nich już jest zaimplementowana)
+      - połóż klocek ''X'' na klocku ''Y'': wykonalna, o ile klocek ''X'' jest aktualnie trzymany, a ''Y'' jest czysty. Po wykonaniu akcji klocek ''X'' leży na klocku ''Y'' i jest czysty, klocek ''Y'' przestaje być czysty i żaden klocek nie jest aktualnie podniesiony.
+      - zdejmij klocek ''X'' z klocka ''Y'': wykonalna, o ile klocek ''X'' jest czysty i aktualnie leży na klocku ''Y''. Po wykonaniu akcji klocek ''X'' przestaje być czysty, przestaje leżeć na klocku ''Y'' i zostaje podniesiony. Klocek ''Y'' natomiast staje się czysty.
+      - połóż klocek ''X'' na stole: analogicznie do akcji pierwszej z taką różnicą, że nie ma wymagań i zmian względem ''Y''
+      - zdejmij klocek ''X'' ze stołu: analogicznie do akcji drugiej
+  - Proszę uruchomić planowanie dla trzech załączonych przykładów oraz dla jednej zamodelowanego samodzielnie.
+  - Proszę usunąć z części warunkowej akcji wszystkie warunki o postaci ''clear/1'' i ponownie uruchomić planowanie dla czterech przypadków.
+      - jaką wartość mają tak wygenerowane plany?
+      - przeczytać pobieżnie [[http://en.wikipedia.org/wiki/Relaxation_%28approximation%29|stronę wikipedii na temat relaksacji]].
-==== Reprezentacja problemu ====
-Standardową reprezentacją problemów planowania jest skierowany graf nazywany **przestrzenią stanów** --- każdy węzeł w grafie odpowiada możliwemu stanowi świata. Dwa wierzchołki są połączone krawędzią, jeśli istnieje akcja, która pozwala na przejście z jednego stanu do drugiego. Problem planowania sprowadza się wtedy do znalezienia ścieżki łączącej wybrany wierzchołek (stan początkowy) z innym wierzchołkiem (stanem końcowym). Problem jest często ogromny (potencjalnie nieskończony) rozmiar przestrzeni stanów i brak oczywistych metod jej przeszukiwania.

pl/dydaktyka/planning/intro.1459900993.txt.gz · ostatnio zmienione: 2019/06/27 15:54 (edycja zewnętrzna)

Pokaż stronę Poprzednie wersje

Menadżer multimediów Do góry

AIwiki

Menu

Dla Studentów

Old specialized AI courses

SMaDA/SMaIDA/AIDA

Informatyka (EAIiIB)

Studia Dr

Inne materialy dydaktyczne

Archiwum

Dyplomanci

Geist Season of Code

HeKatE

Public

Różnice