[發明專利]用于操作學習系統的方法和設備在審
| 申請號: | 202010381572.4 | 申請日: | 2020-05-08 |
| 公開(公告)號: | CN111914992A | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | M.坎德米爾;M.豪斯曼 | 申請(專利權)人: | 羅伯特·博世有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 畢錚;申屠偉進 |
| 地址: | 德國斯*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 操作 學習 系統 方法 設備 | ||
1.一種操作學習系統的計算機實現的方法,其特征在于:
從多個圖像表示中選擇(202)圖像表示(xn);
通過預言來確定(204)針對圖像的至少一個第一標簽的第一表示(y);
通過預測器來在預測中確定(206)至少一個第二標簽的第二表示(yn);
通過預測器、基于圖像表示(xn)、第一表示(y)和第二表示(yn)來確定(208)第二表示(yn)的預測的不確定性;
取決于圖像表示(xn)和/或第二表示(yn)來確定(210)回報(R);以及
取決于所述不確定性并取決于回報(R)來選擇(212)另一圖像的另一表示;
確定用于基于視頻或基于圖像的監視系統、顧客監控系統、安全工程系統、駕駛員輔助系統、多功能舒適系統、在載具控制中具有干預的安全關鍵的輔助系統、用于融合駕駛員信息或駕駛員輔助的系統、機器人系統、家用或花園工作機器人系統、聯網或協作性機器人系統的至少一個控制信號,其中所述控制信號響應于針對學習系統所捕獲的至少一個圖像的輸入、作為所述系統的輸出來被確定,其中圖像取決于圖像、視頻、雷達、LiDAR、超聲或運動傳感器的傳感器輸出來被處理,
其特征在于為了預測器的訓練,取決于獲取函數而從所述多個圖像表示中選擇輸入點的子集,
其中取決于回報(R)和概率狀態(S)來確定所述獲取函數,
其中至少取決于所述不確定性來確定概率狀態(S),
其中通過概率策略預測器、特別是深度貝葉斯神經網、取決于概率狀態(S)并且基于回報(R)來對所述獲取函數進行學習。
2.根據權利要求1所述的方法,其特征在于回報(R)取決于預測器的模型、以及模型擬合的第一度量與模型擬合的第二度量的比較來被確定,其中第一度量取決于在利用表示(xn)來訓練模型之前所確定的模型的至少一個第一參數以及取決于在利用表示(xn)來訓練模型之后所確定的模型的至少一個第二參數來被確定。
3.根據權利要求1或2所述的方法,其特征在于:基于隨機選擇的圖像表示來訓練用于預測第二表示(yn)的概率預測器、特別是高斯過程或深度貝葉斯神經網;以及然后基于取決于回報(R)所選擇的圖像表示來訓練用于預測第二表示(yn)的預測器。
4.根據權利要求1或2 所述的方法,其特征在于輸入點取決于所述獲取函數來被排列在經排列的次序中,并且特別地通過選擇每第k個輸入點來從所述經排列的次序的頂部選擇輸入點的子集,其中k是大于1的自然數。
5.根據權利要求1或2所述的方法,其特征在于所述多個圖像表示被遞歸地處理,其中樣本集合被選自所述多個圖像表示、被加標簽、并且被添加到包括經加標簽的圖像的多個輸入點,其中包括經加標簽的圖像的所述多個輸入點被處理以用于預測器的訓練,并且其中所述樣本集合從所述多個圖像表示中被移除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅伯特·博世有限公司,未經羅伯特·博世有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010381572.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:無線電力傳遞裝置
- 下一篇:用于監控SCR催化凈化器的方法





