もっと詳しく

3つの要点 ?? 複雑なinsertion taskを解くことが出来るOffline meta-RL frameworkの提案 ?? Demonstrationとoffline dataを利用することにより、未知のタスクにおいて素早い適応が可能 ?? 学習時のタスクとテスト時のタスクが大きく異なってもfinetuningにより、12タスク全てにおいて30分以内で100%の…