[發明專利]一種分類模型的訓練方法和裝置在審
| 申請號: | 201810765795.3 | 申請日: | 2018-07-12 |
| 公開(公告)號: | CN109214412A | 公開(公告)日: | 2019-01-15 |
| 發明(設計)人: | 張志偉;吳麗軍;趙偉陽 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類模型 文本特征 評論數據 圖像特征數據 方法和裝置 特征數據 圖像數據 獲取圖像數據 分類結果 數據獲得 數據應用 融合 拼接 圖像 | ||
1.一種分類模型的訓練方法,其特征在于,包括:
獲取圖像數據;
根據所述圖像數據獲得圖像特征數據;
獲取用戶對圖像的評論數據;
根據所述評論數據獲得文本特征數據;
拼接所述圖像特征數據和所述文本特征數據獲得融合特征數據;
采用所述融合特征數據訓練指定分類模型。
2.根據權利要求1所述的方法,其特征在于,所述根據所述圖像數據獲得圖像特征數據,包括:
采用所述圖像數據訓練圖像分類模型;
采用所述訓練后的圖像分類模型從所述圖像數據中提取圖像特征數據。
3.根據權利要求2所述的方法,其特征在于,所述采用所述訓練后的圖像分類模型從所述圖形訓練數據中提取圖像特征數據,包括:
將所述圖像數據輸入到訓練后的圖像分類模型,獲得網絡層的特征數據;
從所述網絡層特征數據中選取最后兩層的特征數據作為圖像特征數據;所述圖像特征數據包括語義特征數據和類別特征數據。
4.根據權利要求1所述的方法,其特征在于,所述根據所述評論數據獲得文本特征數據,包括:
獲取所述用戶對圖像數據的評論數據;
對所述評論數據進行分詞操作得到分詞集合;
去除所述分詞集合中停用詞;
將所述去除分詞集合后的分詞集合作為文本特征數據。
5.一種分類模型的訓練裝置,其特征在于,包括:
圖像數據獲取模塊,用于獲取圖像數據;
圖像特征數據獲得模塊,用于根據所述圖像數據獲得圖像特征數據;
評論數據獲取模塊,用于獲取用戶對圖像的評論數據;
文本特征數據獲得模塊,用于根據所述評論數據獲得文本特征數據;
特征數據拼接模塊,用于拼接所述圖像特征數據和所述文本特征數據獲得融合特征數據;
指定分類模型訓練模塊,用于采用所述融合特征數據訓練指定分類模型。
6.根據權利要求5所述的裝置,其特征在于,所述圖像特征數據獲得模塊包括:
圖像分類模型訓練子模塊,用于采用所述圖像數據訓練圖像分類模型;
圖像特征數據提取子模塊,用于采用所述訓練后的圖像分類模型從所述圖像數據中提取圖像特征數據。
7.根據權利要求6所述的裝置,其特征在于,所述圖像特征數據提取子模塊包括:
網絡層特征數據獲得單元,用于將所述圖像數據輸入到訓練后的圖像分類模型,獲得網絡層的特征數據;
圖像特征數據獲得單元,用于從所述網絡層特征數據中選取最后兩層的特征數據作為圖像特征數據;所述圖像特征數據包括語義特征數據和類別特征數據。
8.根據權利要求5所述的裝置,其特征在于,所述文本特征數據獲得模塊包括:
評論數據獲取子模塊,用于獲取所述用戶對圖像數據的評論數據;
分詞子模塊,用于對所述評論數據進行分詞操作得到分詞集合;
停用詞去除子模塊,用于去除所述分詞集合中停用詞;
文本特征數據獲得子模塊,用于將所述去除分詞集合后的分詞集合作為文本特征數據。
9.一種分類模型的訓練系統,其特征在于,包括:
一個或多個處理器;和
其上存儲有指令的一個或多個機器可讀介質,當由所述一個或多個處理器執行時,使得所述電子設備執行如權利要求1-4一個或多個的一種分類模型的訓練方法。
10.一個或多個機器可讀介質,其上存儲有指令,當由一個或多個處理器執行時,使得所述處理器執行如權利要求1-4一個或多個的一種分類模型的訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810765795.3/1.html,轉載請聲明來源鉆瓜專利網。





