[發明專利]一種基于封面的書籍類型深度學習分類方法在審
| 申請號: | 202110103351.5 | 申請日: | 2021-01-26 |
| 公開(公告)號: | CN112749682A | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 潘曉光;潘曉輝;王小華;張娜;董虎弟 | 申請(專利權)人: | 山西三友和智慧信息技術股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/62;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 太原榮信德知識產權代理事務所(特殊普通合伙) 14119 | 代理人: | 楊凱;連慧敏 |
| 地址: | 030006 山西省*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 封面 書籍 類型 深度 學習 分類 方法 | ||
1.一種基于封面的書籍類型深度學習分類方法,其特征在于,包括以下步驟:
S1、收集圖書封面圖像并制作訓練數據集DTP;
S2、將訓練數據集DTP輸入深度學習模型并進行訓練;
S3、使用S2所得到的深度學習模型對書籍進行分類。
2.根據權利要求1所述的一種基于封面的書籍類型深度學習分類方法,其特征在于:所述步驟S1中,操作步驟為:
S1a、收集大量圖書封面圖像,根據體裁進行將這些圖像分為30個類別并進行標注;
S1b、將所有的圖像調整到224×224的大小,得到圖像數據DP;
S1c、使用視覺應用編程接口對數據集進行文本提取,得到文本數據DT;
S1d、將圖像數據DP、文本數據DT和標注類別數據共同組成訓練數據集DTP。
3.根據權利要求1所述的一種基于封面的書籍類型深度學習分類方法,其特征在于:所述步驟S2中,操作步驟為:
S2a、將訓練數據集DTP中的圖像數據DP輸入基于視覺的深度學習網絡;
S2b、將訓練數據集DTP中的文本數據DT輸入基于文本的深度學習網絡;
S2c、將兩個深度學習的輸出進行直接拼接合并,得到全連接層;
S2d、將全連接層的數據直接輸入softmax層進行分類;
S2e、使用梯度下降方法進行反向傳播,更新網絡參數;
S2f、訓練結束后得到訓練好的深度學習模型。
4.根據權利要求1所述的一種基于封面的書籍類型深度學習分類方法,其特征在于:所述步驟S3中,操作步驟為:
S3a、將封面圖片調整到統一的尺寸224×224,得到圖像數據xP;
S3b、使用谷歌云視覺應用編程接口對原始數據進行文本提取,得到文本數據xT;
S3c、將圖像數據xP和文本數據xT輸入S2所得到的訓練好的模型中進行分類,得到待分類書籍的類別。
5.根據權利要求1所述的一種基于封面的書籍類型深度學習分類方法,其特征在于:所述步驟S2中,深度學習模型包括兩個深度學習網絡、一個全連接層和一個softmax分類器,其中基于視覺的深度學習網絡使用殘差神經網絡模型,基于文本的深度學習網絡使用通用句子編碼器模型。
6.根據權利要求3所述的一種基于封面的書籍類型深度學習分類方法,其特征在于:所述步驟S2e中,梯度下降方法為:其中,θj為神經網絡的參數,α為自行設置的學習率,J(θ)為誤差函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西三友和智慧信息技術股份有限公司,未經山西三友和智慧信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110103351.5/1.html,轉載請聲明來源鉆瓜專利網。





