[發(fā)明專利]一種基于網絡爬蟲和遷移學習的服裝圖像分類方法在審
| 申請?zhí)枺?/td> | 202010908382.3 | 申請日: | 2020-09-02 |
| 公開(公告)號: | CN112036495A | 公開(公告)日: | 2020-12-04 |
| 發(fā)明(設計)人: | 張靜亞;夏鐵恩;潘啟勇 | 申請(專利權)人: | 常熟理工學院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 張俊范 |
| 地址: | 215500 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網絡 爬蟲 遷移 學習 服裝 圖像 分類 方法 | ||
1.一種基于網絡爬蟲和遷移學習的服裝圖像分類方法,其特征在于,包括步驟:基于網絡爬蟲技術的圖像數據集采集;對采集的圖像數據集進行數據清洗得到自建數據集;由預訓練模型導出自建數據集的特征,得到的特征再輸出到分類層模型對分類層模型參數進行訓練;拼接預訓練模型及訓練完的分類模型用以預測服裝圖像的分類。
2.根據權利要求1所述的基于網絡爬蟲和遷移學習的服裝圖像分類方法,其特征在于,所述分類層模型包括依次連接的壓縮激勵模塊層、全局平均池化層、失活層和激活層,所述壓縮激勵模塊層包括依次連接的次級全局平均池化層、次級第一全連接層、RELU激活層、次級第二全連接層、次級Sigmoid激活層和相乘層,所述次級全局平均池化和所述次級第一全連接層對所述自建數據集的特征進行壓縮,使用RELU激活函數擬合通道間相關性,再通過次級第二全連接層和次級Sigmoid激活層生成歸一化的權重特征圖,用歸一化的權重特征圖與預訓練模型輸出的特征圖逐個元素相乘,得到經過權重篩選的特征圖譜。
3.根據權利要求2所述的基于網絡爬蟲和遷移學習的服裝圖像分類方法,其特征在于,所述次級第一全連接層的節(jié)點數為128,所述次級第二全連接層的節(jié)點數為2048。
4.根據權利要求1所述的基于網絡爬蟲和遷移學習的服裝圖像分類方法,其特征在于,所述預訓練模型為Inception預訓練模型或者Xception模型。
5.根據權利要求1所述的基于網絡爬蟲和遷移學習的服裝圖像分類方法,其特征在于,所述基于網絡爬蟲技術的圖像數據集采集包括步驟:(1)選取搜素圖片所需要的URL;(2)需將UTF-8格式的中文或者英文編碼為ASCII碼格式后加入到URL中,再向服務器發(fā)送請求,獲取對應的數據文件;(3)解析數據文件,獲取所要的圖片文件;(4)多次請求獲得所需要數量的圖像。
6.根據權利要求1所述的基于網絡爬蟲和遷移學習的服裝圖像分類方法,其特征在于,所述數據清洗包括步驟:首先對圖像數據集中的圖像文件進行MD5值校驗,如果文件MD5值相同,則對其中一個重復的圖像文件進行刪除;然后設定字節(jié)和尺寸大小閾值,刪除閾值以下的圖像文件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于常熟理工學院,未經常熟理工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010908382.3/1.html,轉載請聲明來源鉆瓜專利網。





