[發明專利]用于訓練表征模型的方法和裝置在審
| 申請號: | 201911024846.8 | 申請日: | 2019-10-25 |
| 公開(公告)號: | CN112347278A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 于偉;王林芳;梅濤 | 申請(專利權)人: | 北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51;G06F16/583 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100176 北京市大興區經濟技*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 訓練 表征 模型 方法 裝置 | ||
1.一種用于訓練表征模型的方法,包括:
基于樣本圖片集的類目信息構建起語義樹;
初始化所述語義樹每條邊的權重;
基于權重執行以下訓練步驟:基于各葉子節點之間最短路徑距離設置待訓練的表征模型的損失函數的截斷系數;基于所述損失函數優化所述表征模型;基于優化后的表征模型計算各樣本圖片之間的距離,轉化為各葉子節點之間最短路徑距離的更新量,根據所述更新量對語義樹上葉子節點連接的邊權重進行更新;若滿足預定條件,則輸出所述表征模型;
否則,基于更新后的權重計算出各葉子節點之間最短路徑距離后繼續執行上述訓練步驟。
2.根據權利要求1所述的方法,其中,所述基于樣本圖片集的類目信息構建起語義樹,包括:
根據語義信息的從屬關系,獲得樣本圖片集的類目信息作為圖片不同等級的標簽;
根據多級標簽構建起語義樹,其中,根節點為物品,下一層節點為一級標簽,依次向下,最底層的葉子節點為最深級標簽。
3.根據權利要求1所述的方法,其中,所述損失函數如下式所示:
其中,i、j、k分別為樣本圖片的索引編號,fi、fj、fk分別表示第i、j、k個樣本圖片的特征。P和N分別為正例/負例的集合,D()計算兩個樣本圖片的距離,Mi,k為兩個樣本圖片最深級標簽對應的截斷系數。
4.根據權利要求3所述的方法,其中,所述截斷系數采用以下形式進行更新:
其中,m為初始值、α為優化步長,Si,j為兩個樣本圖片之間的距離。
5.根據權利要求1所述的方法,其中,所述預定條件包括:
葉子節點之間的最短路徑距離排序不再變化。
6.一種用于輸出信息的方法,包括:
將數據庫中的圖片輸入根據權利要求1-5之一所述的方法訓練好的表征模型得到特征集合;
將目標圖片輸入所述表征模型得到目標特征;
分別計算目標特征與特征集合中的特征的相似度;
按相似度由大到小的順序輸出預定數目的圖片。
7.一種用于訓練表征模型的裝置,包括:
構建單元,被配置成基于樣本圖片集的類目信息構建起語義樹;
初始化單元,被配置成初始化所述語義樹每條邊的權重;
訓練單元,被配置成基于權重執行以下訓練步驟:基于各葉子節點之間最短路徑距離設置待訓練的表征模型的損失函數的截斷系數;基于所述損失函數優化所述表征模型;基于優化后的表征模型計算各樣本圖片之間的距離,轉化為各葉子節點之間最短路徑距離的更新量,根據所述更新量對語義樹上葉子節點連接的邊權重進行更新;若滿足預定條件,則輸出所述表征模型;
循環單元,被配置成若不滿足預定條件,基于更新后的權重計算出各葉子節點之間最短路徑距離后繼續執行上述訓練步驟。
8.一種用于輸出信息的裝置,包括:
建庫單元,被配置成將數據庫中的圖片輸入根據權利要求1-5之一所述的方法訓練好的表征模型得到特征集合;
查詢單元,被配置成將目標圖片輸入訓練好的所述表征模型得到目標特征;
計算單元,被配置成分別計算目標特征與特征集合中的特征的相似度;
按相似度由大到小的順序輸出預定數目的圖片。
9.一種電子設備,包括:
一個或多個處理器;
存儲裝置,其上存儲有一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-6中任一所述的方法。
10.一種計算機可讀介質,其上存儲有計算機程序,其中,所述程序被處理器執行時實現如權利要求1-6中任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司,未經北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911024846.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:烤箱及氣懸浮裝置
- 下一篇:用于輸出信息的方法和裝置





