Ein einfacher Roboter hat vorne in der Mitte einen Tastersensor und links und rechts je einen Lichtsensor. Er steht vor einer Wand (schwarzer Balken) und fährt auf sie zu. Wird sein Tastersensor gedrückt, fährt er für eine kurze Zeit rückwärts und anschliessend wieder vorwärts.
Beobachten Sie verschiedene Simulationen, indem Sie am unteren Rand per Klick ein paar verschiedene Zahlenwerte für λ auswählen. Es startet jeweils eine neue Simulation. Welches Verhalten zeigt der Roboter?
Richtig, der Roboter lernt zur Wand Abstand zu halten. Der Taster kommt nur zu Beginn zum Einsatz, anschliessend setzt der Roboter alleine aufgrund der Messwerte der Lichtsensoren zurück.
Dies erinnert an das Lernen eines Kleinkindes, zur heissen Herdplatte Abstand zu halten. Er spürt allmählich die zunehmende Wärme und wird die Herdplatte nicht mehr berühren.
Je grösser die Zahl λ, desto schneller lernt der Roboter. λ wird als Lernrate bezeichnet.
Die Verbindung zwischen den Lichtsensoren und der Motorsteuerung wird dicker. Dies symbolisiert den Einfluss der Sensoren und wird als Gewicht w bezeichnet.
Studieren Sie die Theorie zu einem "künstlichen Neuron", z.B. in Wikipedia. Stellen Sie die Robotersimulation in den Zusammenhang zur Theorie.
Der Roboter beinhaltet in der Tat ein einfaches Perzeptron, welches nur über zwei Inputs (Lichtsensoren) verfügt. Die beiden Inputwerte (Dunkelheit) werden mit dem Gewicht multipliziert und anschliessend addiert. Liegt diese Summe über einem Schwellenwert, so wird das Neuron aktiviert. Das Perzeptron ist als grüner Kreis dargestellt und wird rot eingefärbt, wenn es aktiviert wird.
Der Tastersensor aktiviert das Neuron in jedem Fall.
Zusatzinfo: Der Schwellenwert des Pezeptrons ist in dieser Simulation auf 0.5 (oder 50%) fixiert.
Wie lernt der Roboter? Aktivieren Sie dazu mit dem Button rechts die Diagrammaufzeichnung und mit der Windrose unterschiedliche "Umwelten".
Das Diagramm zeichnet die Gewichte der beiden Lichtsensoren (blau|rosa) auf. Bei jedem Taster-Ereignis lernt der Roboter und passt die Gewichte nach oben an. Je grösser die Lernrate λ, desto grösser der einzelne Lernfortschritt.
Zusatzinfo: Die Gewichtung wird um die Lernrate multipliziert mit dem Fehler und dem tatsächlich gelieferten Input (i) erhöht:
w' = w + λ * Fehler * i
Der Fehler ist als Differenz zwischen geliefertem und erwartetem Output definiert.
Bei unterschiedlichen Helligkeiten links und rechts schreitet die Gewichtung der beiden Sensoren unterschiedlich voran. Verändert man die Umwelt nach Abschluss der Lernphase, zeigt der Roboter Fehlverhalten. Er rast z.B. erneut in die Wand oder hält sehr grossen Abstand zur Wand.
Bauen Sie einen lernfähigen Roboter nach dem Vorbild dieser Simulation. Dazu eignet sich z.B. LEGO Mindstorms.