Danke für ein Paar (auch nützliche) Ideen und Links.
ABER... um auf die letzten zwei Beiträge einzugehen....
Ihr habt den Dampfkessel zur Stromversorgung vergessen![]()
Hoffentlich liegt das Ziel auch am Weg
..................................................................Der Wegzu einigen meiner Konstruktionen
Hallo,
ich denke da mehr daran wie Computer Tic-tac-toe lernen, so sollten Roboter lernen.
Vielleicht nicht zuerst gegen einen ambitionierten Tic-tac-toe Gegner sondern gegen einfache "Natur". (Natur z.B.: besetzt - ohne weitere Strategie - das erste freie Feld.)
Die volle Komplexität soll es ja gar nicht sein, so hieß es ja am Anfang.
Der Roboter fährt also auf ein Ziel zu, beispielsweise auf eine Lichtquelle.
Dabei trifft er auf ein Hindernis, das eben nicht die Lichtquelle verdeckt, aber seinen Weg blockiert.
Es könnte durchsichtig sein oder halb hoch.
Er muss dann eine Entscheidung treffen, nämlich beispielsweise links oder rechts um das Hindernis herumfahren.
Wenn die Hindernisse so aussehen das eine Richtung beim Ausweichen erfolgreicher ist dann kann er sich das merken, aufsummieren über die Anzahl der Versuche und gegebenenfalls die Erfahrung später auch altern lassen.
(Erfolgreicher hieße in dem Fall vielleicht auch schon: er kann nach seitlichem Versatz ein Stück weiter auf die Lichtquelle zufahren.)
In dem Beispiel wäre das System überschaubar.
Der Lernerfolg wäre, Hindernisse sollte man rechts umfahren, nicht links.
Bei geeigneter Umgebung könnte das ein Lernerfolg sein.
Mit Tic-tac-toe kommt eine Fitnessfunktion (hier: drei gleiche in einer Reihe gewinnt) ins Spiel. Und zwar durchaus verzögert. D.h. ich mache ein paar Züge und berechne erst dann die Fitnessfunktion. Das bringt mehr Flexibilität/Freiheit. Will sagen, nicht jede Aktion (jeder Schritt) muß unmittelbar der Zielmaximierung dienen.
Lesezeichen