[發明專利]視頻對象特征提取方法和裝置、視頻對象匹配方法和裝置有效
| 申請號: | 201811527701.5 | 申請日: | 2018-12-13 |
| 公開(公告)號: | CN111325198B | 公開(公告)日: | 2023-05-16 |
| 發明(設計)人: | 陳廣義;魯繼文;楊銘;周杰 | 申請(專利權)人: | 北京地平線機器人技術研發有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V10/75;G06V10/40 |
| 代理公司: | 北京布瑞知識產權代理有限公司 11505 | 代理人: | 孟潭 |
| 地址: | 100080 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 對象 特征 提取 方法 裝置 匹配 | ||
1.一種視頻對象特征提取方法,包括:
獲取視頻流的每個視頻幀中待識別對象所在像面的各組成區域的局部特征信息,其中,所述待識別對象所在像面由多個組成區域構成;
獲取每個所述視頻幀中待識別對象所在像面的各組成區域的空域分值其中,所述空域分值用于評價所述視頻幀中待識別對象所在像面的組成區域的圖像質量;以及
根據所獲取的每個所述視頻幀中待識別對象所
在像面的各組成區域的所述局部特征信息和所述空域分值,獲取所述待識別對象所在像面的各組成區域的綜合局部特征信息;
其中,所述根據所獲取的每個所述視頻幀中待識別對象所在像面的各組成區域的所述局部特征信息和所述空域分值,獲取所述待識別對象所在像面的綜合局部特征信息包括:
以所述組成區域對應每個所述視頻幀的所述空域分值為權重,將所述組成區域對應每個所述視頻幀的所述局部特征信息整合為該所述組成區域的所述綜合局部特征信息。
2.根據權利要求1所述的方法,其特征在于,所述獲取每個所述視頻幀中待識別對象所在像面的各組成區域的空域分值包括:
將每個所述視頻幀輸入時空評價神經網絡模型;以及
獲取所述時空評價神經網絡模型輸出的每個所述視頻幀中待識別對象所在像面的各組成區域的空域分值。
3.根據權利要求2所述的方法,進一步包括:
通過連續的近似符號函數將所述各組成區域的所述空域分值映射到0至1之間。
4.根據權利要求1所述的方法,其中,所述獲取視頻流的每個視頻幀中待識別對象所在像面的各組成區域的局部特征信息包括:
獲取每個視頻幀中所述待識別對象的全局特征圖;
識別每個視頻幀中所述待識別對象所在像面的各組成區域;以及
根據每個視頻幀的所述全局特征圖以及所述各組成區域,獲取每個所述視頻幀中待識別對象所在像面的各組成區域的局部特征信息。
5.根據權利要求4所述的方法,其中,所述獲取所述視頻流的每個視頻幀中所述待識別對象的全局特征圖包括:
將每個所述視頻幀輸入第一全局特征提取神經網絡模型;以及
獲取所述第一全局特征提取神經網絡模型輸出的每個視頻幀的所述全局特征圖。
6.根據權利要求4所述的方法,其中,所述識別每個視頻幀中所述待識別對象所在像面的各組成區域包括:
識別視頻幀中的多個特征識別點;以及
根據所述多個特征識別點識別所述待識別對象所在像面的各組成區域,其中每個所述組成區域根據至少兩個所述特征識別點的位置確定。
7.根據權利要求4所述的方法,其中,所述根據每個視頻幀的所述全局特征圖以及識別出的所述各組成區域,獲取每個所述視頻幀中待識別對象所在像面的各組成區域的局部特征信息包括:
將所述視頻幀的所述全局特征圖和所述視頻幀中待識別對象所在像面的各組成區域進行感興趣區域池化處理;
將所述感興趣區域池化處理的結果輸入局部特征提取神經網絡模型;以及
獲取所述局部特征提取神經網絡模型輸出的所述視頻幀中待識別對象所在像面的各組成區域的局部特征信息。
8.根據權利要求4所述的方法,進一步包括:
將每個所述視頻幀的所述全局特征圖輸入第二全局特征提取神經網絡模型;以及
獲取第二全局特征提取神經網絡模型輸出的所述視頻流中所述待識別對象的全局特征信息。
9.根據權利要求1所述的方法,進一步包括:
根據每個所述視頻幀中待識別對象所在像面的各組成區域的空域分值,獲取所述待識別對象所在像面的各組成區域的綜合空域分值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京地平線機器人技術研發有限公司,未經北京地平線機器人技術研發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811527701.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型插排
- 下一篇:一種探頭按鍵裝置、超聲設備和探頭按鍵的通信方法





