Künstliche Intelligenz (KI) und Maschinelles Lernen (ML): verstärkendes Lernen

Bedienung

  • Mit der Leertaste kann die Anzeige variiert werden.
  • Mit 'n' wird die Wertetabelle zurückgesetzt.
  • Mit 's' kann ein Screenshot gespeichert werden.

verstärkendes Lernen

Ein Agent, hier der Affe, lernt selbständig dank Belohnung und Bestrafung. In seiner Umwelt bewegt sich einzig ein Fass. Der Affe unterscheidet bezüglich des Fasses 20 Positionen (Zustände). Pro Zustand merkt er sich eine Wahrscheinlichkeit, mit welcher er abwartet. Zu Beginn ist diese Wahrscheinlichkeit für alle Zustände gleich 0.33, d.h. der Affe wartet in einem Drittel der Fälle ab. Er hüpft in zwei von drei Fällen und ist damit fast hyperaktiv.

Abhängig von der Höhe der Belohnung und/oder Bestrafung und der Lernrate lernt der Affe auf unterschiedliche Weise.

Beobachtungsaufgaben

  1. Wie verändern sich die Wahrscheinlichkeiten in der Tabelle? Wie gross sind die Änderungen?
  2. Wie lernt der Affe, wenn er nur für korrekte Sprünge belohnt wird?
  3. Welches Verhalten resultiert, wenn der Affe einzig für fehlerhafte Sprünge bestraft wird?
  4. Wie verändert sich das Verhalten des Affen, wenn er nur für unnötige Sprünge bestraft wird?
  5. Welche Auswirkungen hat eine maximale Lernrate?