深層強化学習を用いた多自由度アクチュエータの姿勢制御

産業用ロボットのアクチュエータには高出力密度や高応答性だけでなく,高精度な多自由度動作が要求されます。しかし,従来の多自由度駆動機構は1自由度アクチュエータを組み合わせて構成されているため,各アクチュエータの累積誤差および機構の大型化が課題となります。

これに対し,多自由度アクチュエータは1台で多自由度駆動が可能であり,高精度化および小型化が見込めるため応用が期待されています。しかし,姿勢に応じて非線形にトルク特性が変化するため,姿勢制御には各姿勢とトルク特性の関係を表すトルクマップを事前に測定・予測する必要があります。トルクマップは磁場解析による取得も可能ですが,実機でのトルクマップと解析誤差が生じるため位置決め精度低下の原因となります。

そこで,トルクマップを要さない姿勢制御系の構築を目的として,深層強化学習を用いた,多自由度アクチュエータの3自由度学習制御系を提案しています。

MachineLearning.pdf