[發明專利]從短期意圖和長期結果生成軌跡標記在審
| 申請號: | 202011492384.5 | 申請日: | 2020-12-17 |
| 公開(公告)號: | CN113052321A | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | K.雷法特;S.羅斯 | 申請(專利權)人: | 偉摩有限責任公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06N5/00;G06N3/04 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 金玉潔 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 短期 意圖 長期 結果 生成 軌跡 標記 | ||
1.一種生成用于訓練機器學習模型執行軌跡預測的訓練數據的方法,包括:
獲得訓練輸入,所述訓練輸入包括:(i)表征截至第一時間環境中代理的數據,和(ii)表征在第一時間之后的第一時間段內環境中代理的候選軌跡的數據;
確定指示代理在第一時間之后的第一時間段內是否實際遵循候選軌跡的候選軌跡的長期標記;
確定指示代理是否打算遵循候選軌跡的候選軌跡的短期標記;
基于候選軌跡的長期標記和短期標記,確定候選軌跡的地面真值概率,其中,候選軌跡的地面真值概率是應由機器學習模型分配給候選軌跡的概率;以及
將訓練輸入與訓練數據中候選軌跡的地面真值概率相關聯。
2.根據權利要求1所述的方法,還包括:
在訓練數據上訓練機器學習模型。
3.根據權利要求1所述的方法,其中,基于候選軌跡的長期標記和短期標記,確定候選軌跡的地面真值概率包括:
確定長期標記指示代理在第一時間之后實際遵循候選軌跡;
確定短期標記指示代理打算遵循候選軌跡;以及
基于確定長期標記指示代理在第一時間之后實際遵循候選軌跡并確定短期標記指示代理打算遵循候選軌跡,將候選軌跡的地面真值概率設置為等于1。
4.根據權利要求1所述的方法,其中,基于候選軌跡的長期標記和短期標記,確定候選軌跡的地面真值概率包括:
確定長期標記指示代理在第一時間之后實際并未遵循候選軌跡;
確定短期標記指示代理不打算遵循候選軌跡;以及
基于確定長期標記指示代理在第一時間之后實際并未遵循候選軌跡并確定短期標記指示代理不打算遵循候選軌跡,將候選軌跡的地面真值概率設置為等于0。
5.根據權利要求1所述的方法,其中,基于候選軌跡的長期標記和短期標記,確定候選軌跡的地面真值概率包括:
確定長期標記指示代理在第一時間之后實際遵循候選軌跡;
確定短期標記指示代理不打算遵循候選軌跡;以及
基于確定長期標記指示代理在第一時間之后實際遵循候選軌跡并確定短期標記指示代理不打算遵循候選軌跡,將候選軌跡的地面真值概率設置為等于零和一之間的第一值。
6.根據權利要求1所述的方法,其中,基于候選軌跡的長期標記和短期標記,確定候選軌跡的地面真值概率包括:
確定長期標記指示代理在第一時間之后實際并未遵循候選軌跡;
確定短期標記指示代理打算遵循候選軌跡;以及
基于確定長期標記指示代理在第一時間之后實際并未遵循候選軌跡并確定短期標記指示代理打算遵循候選軌跡,將候選軌跡的地面真值概率設置為等于零和一之間的第二值。
7.根據權利要求1所述的方法,其中,基于候選軌跡的長期標記和短期標記,確定候選軌跡的地面真值概率包括:
確定長期標記與短期標記不一致,包括:
確定長期標記指示代理在第一時間之后并未實際遵循候選軌跡,短期標記指示代理打算遵循候選軌跡,或
確定長期標記指示代理在第一時間之后實際遵循候選軌跡,并且確定短期標記指示代理不打算遵循候選軌跡;
獲得環境的情境信息;
基于環境的情境信息,使用一個或多個預定規則生成更新的短期標記;以及
基于候選軌跡的長期標記和更新的短期標記,確定候選軌跡的地面真值概率。
8.根據權利要求1所述的方法,其中,確定指示代理在第一時間之后是否實際遵循候選軌跡的候選軌跡的長期標記包括:
確定在第一時間之后跟蹤代理的移動的日志數據是否指示代理在第一時間之后遵循候選軌跡。
9.根據權利要求1所述的方法,其中,確定指示代理是否打算遵循候選軌跡的候選軌跡的短期標記包括:
確定在緊接第一時間之后的初始時間段內代理是否遵循候選軌跡,其中,所述初始時間段短于第一時間段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于偉摩有限責任公司,未經偉摩有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011492384.5/1.html,轉載請聲明來源鉆瓜專利網。





