ロボットのAIブレインを、より単純なタスクを処理するモジュールに分割することは、ロボットをより迅速にトレーニングできることを意味しますが、それは適応性を犠牲にしてもたらされる可能性があります
テクノロジー
2022年4月6日
ロボットは、訓練に必要な時間と労力を削減する新しい方法を使用してドアを開けることを学びましたが、その効率は適応性を犠牲にしてもたらされる可能性があります。
ロボットは、タスクを完了するための何千回もの試行錯誤の試みで訓練された深層学習モデルによって制御されることがよくあります。 代わりに、東京の早稲田大学の伊藤博と彼の同僚は、モデルをモジュールに分割し、1つはドアに近づくときにロボットを制御し、もう1つはドアを開くために引き継ぎ、もう1つは入り口を通過する処理を行いました。 タスクごとに、ロボットには、引き開くドア用のモジュールと、押し開くドア用のモジュールが1つずつありました。
ロボットは、6つのモジュールのそれぞれについて6時間のトレーニングを受け、人間が108回タスクを実行する方法を示しました。 これは、各モジュールがより小さく、より単純なタスクでトレーニングされたため、単一のモデルが必要とするトレーニングよりも全体的に少ないトレーニングです。 伊藤氏によると、グーグルの研究者による同等の問題は、14台のロボットを並行して使用して2か月のトレーニングを要したという。
トレーニング後、ロボットはそのタスクを96%の時間で達成しました。 あるテストでは、ドアを30分間まっすぐ前後に行き来し、15回の往復を完了しました。
ロボットはすべてのモジュールを継続的に実行します。 それぞれが次に何をすべきかを提案し、「操作セレクター」が状況に最も適切なアクションを選択し、必要に応じて1つのモジュールから別のモジュールに切り替えます。 チームは、新しいタイプのドアで動作するようにモデル全体をトレーニングするのではなく、そのドアを開くためのモジュールを挿入できるため、これにより適応性が向上する可能性があることを示唆しています。
Sethu Vijayakumar 英国のエジンバラ大学では、このアプローチにはメリットがあると述べていますが、1つの大きなモデルでパフォーマンスを向上させる可能性のある追加のトリックを学習できますが、個別のモジュールでは学習できる内容が制限されています。 たとえば、単一のモデルがドアハンドルに近づいたときに重要な詳細を観察できますが、ロボットが到着した後にドアを開こうとする単一のモジュールはこれらの詳細を観察しません。
「これにより、メソッドのデータ効率が向上したと思います。 私がまだ非常に懐疑的であるのは、一般化可能性です」と彼は言います。 「機械学習にはフリーランチのようなものはありません。」
ジャーナルリファレンス: サイエンスロボティクス、 DOI:10.1126 / scirobotics.aax8177
これらのトピックの詳細:
The post ロボットは、タスクを3つの簡単なステップに分割することでドアを開けることを学びます appeared first on Gamingsym Japan.