[發明專利]信息處理裝置和信息處理方法在審
| 申請號: | 201880090057.1 | 申請日: | 2018-12-05 |
| 公開(公告)號: | CN111742270A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 木村友哉;福井啟 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G05B13/04 | 分類號: | G05B13/04;G05B17/02;G05B11/36;G05B11/42;G05D1/02;G05D13/62;B25J9/16;B25J13/00 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 吳孟秋 |
| 地址: | 日本*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 信息處理 裝置 方法 | ||
[問題]為了更容易和有效地吸收模擬器模型和真實機器人的運動特性的差異。[解決方案]提供了一種信息處理裝置,包括:通信單元,其接收基于控制命令值的自主移動體的操作結果;以及參數近似單元,其基于自主移動體的操作結果近似用于自主移動體的移動模擬的模擬器模型的運動特性參數。所述參數近似單元基于以下之間的相似度來近似運動特性參數:基于控制命令值在移動模擬中基于不同的運動特性參數而獲得的多個模擬結果;以及自主移動體的操作結果。
技術領域
本公開涉及信息處理裝置和信息處理方法。
背景技術
近年來,已經研究了將模擬器上的模型的學習結果應用于真實機器人的技術。此外,還提出了如上所述的用于吸收模型和真實機器人之間的運動特性差異的技術。例如,非專利文獻1公開了通過使用深度神經網絡來轉換控制命令值,以便使真實機器人執行與模擬器上的模型的運動相同的運動的技術。
引用列表
非專利文獻
非專利文獻1:Wojciech Zaremba和其他七人的“Transfer from Simulation toReal World through Learning Deep Inverse Dynamics Model”,2016年10月11日,[網上],[2018年2月26日檢索],互聯網
發明內容
技術問題
然而,在非專利文獻1中公開的技術中,需要基于真實機器人的大量移動數據進行訓練。此外,在使用該技術的情況下,由于每次都由深層神經網絡轉換控制命令值,所以計算成本傾向于增加。
因此,本公開提出了新穎且改進的信息處理裝置和信息處理方法,其能夠更容易和有效地吸收模擬器模型和真實機器人之間的運動特性差異。
問題的解決方案
根據本公開,提供了一種信息處理裝置,包括:通信單元,其接收自主移動體基于控制命令值的移動結果;以及參數近似單元,其基于自主移動體的移動結果來近似模擬器模型的運動特性參數以用于自主移動體的移動模擬,其中,所述參數近似單元根據基于多個模擬結果與所述自主移動體的移動結果之間的相似度,來近似所述運動特性參數,根據在移動模擬中基于控制命令值的不同運動特性參數獲得多個模擬結果。
此外,根據本公開,提供了一種信息處理方法,包括由處理器:接收自主移動體基于控制命令值的移動結果;并且基于自主移動體的移動結果,近似用于自主移動體的移動模擬的模擬器模型的運動特性參數,其中,所述近似還包括根據基于多個模擬結果與所述自主移動體的移動結果之間的相似度,來近似所述運動特性參數,根據在移動模擬中基于控制命令值的不同運動特性參數獲得多個模擬結果。
發明的有益效果
如上所述,根據本公開,可以更容易和有效地吸收模擬器模型和真實機器人之間的運動特性差異。
注意,上述效果不一定是限制性的,并且利用或代替上述效果,可以實現本說明書中描述的任何一種效果或可以從本說明書中理解的其他效果。
附圖說明
圖1是用于描述根據本公開的實施方式的由運動特性導致的控制速度的偏差的示圖;
圖2是用于描述根據實施方式的由運動特性導致的軌跡偏差的示圖;
圖3是用于描述根據實施方式的運動特性參數的近似的示圖;
圖4是示出根據實施方式的信息處理系統的配置示例的框圖;
圖5是示出根據實施方式的自主移動體和信息處理服務器的功能配置示例的框圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880090057.1/2.html,轉載請聲明來源鉆瓜專利網。





