[發明專利]一種分類模型的訓練方法和裝置在審
| 申請號: | 201810765795.3 | 申請日: | 2018-07-12 |
| 公開(公告)號: | CN109214412A | 公開(公告)日: | 2019-01-15 |
| 發明(設計)人: | 張志偉;吳麗軍;趙偉陽 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類模型 文本特征 評論數據 圖像特征數據 方法和裝置 特征數據 圖像數據 獲取圖像數據 分類結果 數據獲得 數據應用 融合 拼接 圖像 | ||
本發明實施例提供了一種分類模型的訓練方法和裝置,所述方法包括:獲取圖像數據;根據所述圖像數據獲得圖像特征數據;獲取用戶與圖像之間的評論數據;根據所述評論數據獲得文本特征數據;拼接所述圖像特征數據和所述文本特征數據獲得融合特征數據;采用所述融合特征數據訓練指定分類模型。本發明實施例將文本特征數據應用到指定分類模型中,由于文本特征數據會隨著用戶與圖像數據之間評論數據越來越多,從而使得分類模型的分類結果變得越加準確。
技術領域
本發明涉及數據處理技術領域,特別是涉及一種分類模型的訓練方法、一種分類模型的訓練裝置以及一個或多個機器可讀介質。
背景技術
圖像分類是根據圖像的語義信息將不同類別圖像區分開來,是計算機視覺中重要的基本問題,也是圖像檢測、圖像分割、物體跟蹤、行為分析等其他高層視覺任務的基礎。
近年來,深度學習在視頻圖像、語音識別、自然語言處理等相關領域獲得了廣泛應用。卷積神經網絡(CNN,Convolutional Neural Network)作為深度學習的一個重要分支,由于其超強的擬合能力以及端到端的全局優化能力,使得圖像分類任務在應用卷積神經網絡之后,預測精度大幅提升。
在使用卷積神經網絡模型對未知數據進行預測時,一般采用的方式為:
(1)根據已知的數據集,離線訓練一個分類模型;
(1)加載預先訓練好的模型參數,對未知數據進行預測。
這種方式是靜態地對數據進行預測,利用的信息僅有圖像或者其它的多媒體數據信息,所以這種方式存在下面兩個缺點:
(1)無論采用何種訓練算法,采用何種網絡結構,數據規模限制著基于卷積神經網絡模型的精度上限;
(2)卷積神經網絡模型是靜態的,不會隨著時間的推移變得原來越準,相反的往往會在模型運行一定時間之后出現模型退化的情況。
發明內容
鑒于上述問題,提出了本發明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種分類模型的訓練方法、一種分類模型的訓練裝置以及一個或多個機器可讀介質。
為了解決上述問題,本發明實施例公開了一種分類模型的訓練方法,包括:
獲取圖像數據;
根據所述圖像數據獲得圖像特征數據;
獲取用戶對圖像的評論數據;
根據所述評論數據獲得文本特征數據;
拼接所述圖像特征數據和所述文本特征數據獲得融合特征數據;
采用所述融合特征數據訓練指定分類模型。
優選地,所述根據所述圖像數據獲得圖像特征數據,包括:
采用所述圖像數據訓練圖像分類模型;
采用所述訓練后的圖像分類模型從所述圖像數據中提取圖像特征數據。
優選地,所述采用所述訓練后的圖像分類模型從所述圖形訓練數據中提取圖像特征數據,包括:
將所述圖像數據輸入到訓練后的圖像分類模型,獲得網絡層的特征數據;
從所述網絡層特征數據中選取最后兩層的特征數據作為圖像特征數據;所述圖像特征數據包括語義特征數據和類別特征數據。
優選地,所述根據所述評論數據獲得文本特征數據,包括:
獲取所述用戶對圖像數據的評論數據;
對所述評論數據進行分詞操作得到分詞集合;
去除所述分詞集合中停用詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810765795.3/2.html,轉載請聲明來源鉆瓜專利網。





