[發(fā)明專利]在線訓練的場景描述機器人系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 201910974489.5 | 申請日: | 2019-10-14 |
| 公開(公告)號: | CN110852171A | 公開(公告)日: | 2020-02-28 |
| 發(fā)明(設計)人: | 李秀;宋愷祥;段桂春 | 申請(專利權)人: | 清華大學深圳國際研究生院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;A61H3/06 |
| 代理公司: | 深圳新創(chuàng)友知識產權代理有限公司 44223 | 代理人: | 江耀純 |
| 地址: | 518055 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 在線 訓練 場景 描述 機器人 系統(tǒng) 方法 | ||
1.一種場景描述機器人的在線訓練方法,其特征在于:
A1、接收新的圖像-文本對數據;
A2、根據所述新的圖像-文本對數據構建訓練集;
A3、使用所述訓練集對訓練狀態(tài)的圖像-文本模型進行訓練,得到訓練好的訓練模型;
A4、根據所述訓練好的訓練模型對用于服務的測試狀態(tài)的圖像-文本模型進行更新。
2.根據權利要求1所述的在線訓練方法,其特征在于所述A2包括:
對每一條所述新的圖像-文本對數據均賦予一個樣本權重;其中,所述樣本權重隨著所述新的圖像-文本對數據上傳的時間與當前時間的間隔成負相關;
基于所述樣本權重將所述新的圖像-文本對數據采集到所述訓練集中。
3.根據權利要求2所述的在線訓練方法,其特征在于所述A2還包括:
提取每一個所述新的圖像-文本對數據的全局特征;
將所述新的圖像-文本對數據的全局特征與全部數據集中的所有樣本進行比對排序,選出相似度最高的N個樣本與相似度最低的N個樣本一同加入所述訓練集;其中,N為整數。
4.根據權利要求1所述的在線訓練方法,其特征在于所述使用所述訓練集對訓練狀態(tài)的圖像-文本模型進行訓練包括:使用所述訓練集,通過神經網絡結構搜索方法搜索訓練模型的網絡結構和參數。
5.根據權利要求4所述的在線訓練方法,其特征在于:所述神經網絡結構搜索方法為基于梯度優(yōu)化的pdarts網絡結構搜索算法。
6.根據權利要求5所述的在線訓練方法,其特征在于所述網絡結構搜索的過程分成四個階段:階段一的搜索空間有八種,在訓練過程中把不重要的候選操作去掉;階段二的搜索空間有四種;階段三的搜索空間有兩種;階段四還剩下一個最重要的候選操作。
7.根據權利要求6所述的在線訓練方法,其特征在于:在搜索網絡結構的過程中,維護不同的矩陣;所述矩陣代表搜索空間中每種可選操作的權重;所述階段一維護的矩陣是12*8維,表示12條路徑,8種搜索空間;所述階段二維護的矩陣是12*4維,表示12條路徑,4種搜索空間;所述階段三維護的矩陣為12*2維,表示12條路徑,2種搜索空間;所述階段四維護的矩陣為12*1,表示最后還剩下一個最重要的候選操作。
8.一種在線訓練的場景描述機器人系統(tǒng),其特征在于:包括導盲機器人和服務器;所述服務器包括計算機程序,所述計算機程序用于運行后執(zhí)行根據權利要求1至7任一項所述方法。
9.根據權利要求8所述的場景描述機器人系統(tǒng),其特征在于:所述導盲機器人通過無線網絡與所述服務器連接;所述無線網絡的具體形式包括4G網絡和5G網絡。
10.一種計算機可讀存儲介質,其特征在于:所述計算機可讀存儲介質中存儲有程序指令,所述程序指令被計算機的處理器執(zhí)行時使所述處理器執(zhí)行根據權利要求1至7任一項所述方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學深圳國際研究生院,未經清華大學深圳國際研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910974489.5/1.html,轉載請聲明來源鉆瓜專利網。





