KI: verstärkendes Lernen

Bedienung

Mit der Leertaste kann die Anzeige variiert werden.
Mit 'n' wird die Wertetabelle zurückgesetzt.
Mit 's' kann ein Screenshot gespeichert werden.

verstärkendes Lernen

Ein Agent, hier der Affe, lernt selbständig dank Belohnung und Bestrafung. In seiner Umwelt bewegt sich einzig ein Fass. Der Affe unterscheidet bezüglich des Fasses 20 Positionen (Zustände). Pro Zustand merkt er sich eine Wahrscheinlichkeit, mit welcher er springt. Zu Beginn ist diese Wahrscheinlichkeit für alle Zustände gleich 0.33, d.h. der Affe springt nur in einem Drittel der Fälle. Er wartet in zwei von drei Fällen und ist zu Beginn phlegmatisch.

Abhängig von der Höhe der Belohnung und/oder Bestrafung und der Lernrate lernt der Affe auf unterschiedliche Weise.

Beobachtungsaufgaben

Wie verändern sich die Wahrscheinlichkeiten in der Tabelle? Wie gross sind die Änderungen?
Wie lernt der Affe, wenn er nur für korrekte Sprünge belohnt wird?
Welches Verhalten resultiert, wenn der Affe einzig für fehlerhafte Sprünge bestraft wird?
Wie verändert sich das Verhalten des Affen, wenn er nur für unnötige Sprünge bestraft wird?
Welche Auswirkungen hat eine maximale Lernrate?

Künstliche Intelligenz (KI) und Maschinelles Lernen (ML): verstärkendes Lernen

Bedienung

verstärkendes Lernen

Beobachtungsaufgaben