強化学習ロボットは、あらかじめ動作がプログラミングされているものとは違い、命令に対する動作を、試行錯誤しながら実行する、人工知能を持っています。プログラム以上の動きをすることも期待できます。未知の環境においても、学習→動作するので、様々な用途に応用できます。

前に進めという命令を出す。

一般ロボットの場合



あらかじめ前進するためのプログラムがされています。
→すんなり前進。

強化学習ロボットの場合

1.前進するというプログラムがされていないので、動くことができません。
2.とりあえず動いてみて、試行錯誤します。徐々にコツをつかんでいきます。
 
3.遂には歩けるように!
経験を積めば積むほど、自由に動けるようになります。