[發明專利]用于控制機器人的方法和設備在審
| 申請號: | 202110181323.5 | 申請日: | 2021-02-10 |
| 公開(公告)號: | CN113341945A | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | C-N·施特雷勒;S·J·艾特薩米 | 申請(專利權)人: | 羅伯特·博世有限公司 |
| 主分類號: | G05D1/02 | 分類號: | G05D1/02 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 任一方;周學斌 |
| 地址: | 德國斯*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 控制 機器人 方法 設備 | ||
1.一種用于控制機器人的方法,所述方法包括:
獲取表示機器人環境的傳感器數據;
根據傳感器數據標識機器人環境中的一個或多個對象;
將所述一個或多個對象中的每一個和機器人與多智能體系統的相應智能體相關聯;
為多智能體系統的每個智能體確定質量度量,所述質量度量包括針對一位置處的移動動作的獎勵項和取決于其他智能體在一時間處占用與所述智能體相同位置的概率的耦合項;
確定機器人的移動策略,所述移動策略以比具有為機器人確定的質量度量的較低值的移動動作更高的概率選擇具有質量度量的較高值的移動動作;以及
根據移動策略控制機器人。
2.根據權利要求1所述的方法,其中耦合項是其他智能體的占用度量的泛函,其中,對于每個智能體,位置和時間的占用度量標示智能體在所述時間處于所述位置中的可能性。
3.根據權利要求1或2所述的方法,其中確定質量度量包括在多次迭代中迭代地確定質量度量,其中每次迭代包括在多個時間步長之上從初始時間到結束時間的前向傳遞和在多個時間步長之上從結束時間到初始時間的后向傳遞。
4.根據權利要求3所述的方法,其中耦合項是其他智能體的占用度量的泛函,并且前向傳遞包括通過使用智能體在當前時間步長處的策略來傳播智能體的當前時間步長的占用度量,為每個智能體更新下一時間步長的占用度量。
5.根據權利要求3或4所述的方法,其中耦合項是其他智能體的占用度量的泛函,并且后向傳遞包括通過在下一時間步長處使用其他智能體的占用度量,為每個智能體更新在當前時間步長處的智能體的質量度量和策略。
6.根據權利要求1至5中任一項所述的方法,其中確定移動策略,使得取決于為機器人確定的質量度量,根據玻爾茲曼分布來分布用于多智能體系統的系統狀態的動作。
7.一種機器人控制器,被配置為執行權利要求1至6中任一項的方法。
8.一種包括指令的計算機程序,所述指令當由計算機執行時,使得計算機執行根據權利要求1至6中任一項的方法。
9.一種包括指令的計算機可讀介質,所述指令當由計算機執行時,使得計算機執行根據權利要求1至6中任一項的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅伯特·博世有限公司,未經羅伯特·博世有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110181323.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于產生旋轉光束的光纖
- 下一篇:驅動面板的集成電路和包括集成電路的顯示裝置





