Bastiaan Ekeler、Marnick Menting、ビリーSchonenberg、ゲリットウィレム·ヴォスによって
モジュールでマスターでロボットの学習工業デザインでアイントホーフェン工科大学の学生がプログラムされ、 AdMoVeoロボット使って処理言語。 Q-学習アルゴリズムはスクラッチから書かれていた。
ので、彼らは、USBケーブルを使用したのXBeeが何かに干渉しました。
のビデオで見ることができるようにロボットは最初にプラス(緑の光)またはアルゴリズムからの負(赤色光)の報酬を得るかどうかを確認するためにランダムな行動をしようとします。 いくつかの訓練の後、ロボットは完全に光をフォローすることができる。
詳細とソースコードmmenting.nl

















































