This page is written in Japanese.

To the English version of this page.

強化学習の適用例:ロボットの移動動作獲得

ここで示す例は,強化学習が持つ以下の2つの特徴について示すことを意図している。 以下に示すように,異なるメカニズムを持つロボットを 同一の学習アルゴリズムによってそれぞれに適した制御規則を獲得させることによって, 強化学習の汎用性を示す。

8自由度4脚ロボット (2002.03.07)

OCT1_.jpg OCT2_.jpg

8自由度4脚ロボットの詳細な説明ページへ

強化学習によってまっすぐ前進する制御規則を試行錯誤によって獲得する。

2自由度ロボット

ROBOTS_.jpg
Fig.A,B: 学習対象としたロボット機構のその模式図. Aはボディから2節リンクアームが張り出す構造を持ち,Bはボディにねじりと曲 げを行う構造を持つ. AとBはメカニズム的に全く異なるが,完全に同じ学習アルゴリズム を適用可能.

2自由度ロボットの詳細な説明ページへ

強化学習によって前進する制御規則を試行錯誤によって獲得する。

5リンク環状ロボット


画像に示すように5つのリンクを環状につないだ構造のロボットで,2箇所の関節のみをモーターで駆動して 形を変える。転がって進むような制御規則を強化学習により試行錯誤を通じて獲得する。 左右非対称な構造のため,ハンドコーディングによるプログラミングは難しい。
5リンク環状ロボットの詳細な説明ページへ
質問やコメント等はメールにてどうぞ:
EMAIL.gif