[發明專利]一種基于封面的書籍類型深度學習分類方法在審
| 申請號: | 202110103351.5 | 申請日: | 2021-01-26 |
| 公開(公告)號: | CN112749682A | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 潘曉光;潘曉輝;王小華;張娜;董虎弟 | 申請(專利權)人: | 山西三友和智慧信息技術股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/62;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 太原榮信德知識產權代理事務所(特殊普通合伙) 14119 | 代理人: | 楊凱;連慧敏 |
| 地址: | 030006 山西省*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 封面 書籍 類型 深度 學習 分類 方法 | ||
本發明涉及圖書管理技術領域,更具體而言,涉及一種基于封面的書籍類型深度學習分類方法。包括以下步驟:S1、收集圖書封面圖像并制作訓練數據集DTP;S2、將訓練數據集DTP輸入深度學習模型并進行訓練;S3、使用S2所得到的深度學習模型對書籍進行分類。S2中,深度學習模型包括兩個深度學習網絡、一個全連接層和一個softmax分類器,基于視覺的深度學習網絡使用殘差神經網絡模型,基于文本的深度學習網絡使用通用句子編碼器模型。本發明具有更高的分類準確率和更高的適用性和穩定性,能夠對書籍進行快速,有效的分類,精度高,速度快。本發明主要應用與書籍類型分類方面。
技術領域
本發明涉及圖書管理技術領域,更具體而言,涉及一種基于封面的書籍類型深度學習分類方法。
背景技術
書的封面通常是讀者的第一印象,它們經常傳達關于書的內容的重要信息。隨著圖書的完全數字化進程的不斷推進,基于封面的圖書類型分類對于許多現代檢索系統來說是一項極其重要的內容。解決此問題的主要難點如下:第一,書的體裁種類繁多,有很多沒有具體界定;第二,書的封面,如顏色,風格,文本信息等,即使是同一類型的書之間,也具有很大的差異;第三,由于國家、文化、目標讀者群體等外部因素的影響,書籍的封面設計也會有所不同。隨著圖書行業的競爭力日益增強,為了能吸引讀者,圖書封面設計師將封面設計推向了一個新的高度。
廣東技術師范大學蔡君等人在其申請的專利文獻“一種基于深度學習的書脊文本識別方法、設備及存儲介質”(申請號202010182949.3申請日2020.09.18申請公布號:CN111680684A)中公開了一種基于深度學習的書脊文本識別方法、設備及存儲介質。該發明內容包括:制作合成書脊、單字多字體和真實書脊數據集;基于CTPN模型對單本書脊進行文本檢測;針對文本模糊特點搭建基于ResNet10的書脊文本識別模型STRNet;針對字體多樣特點制作SK-NNS分類器等。該發明的不足之處為:該發明僅是書籍的文字信息識別,并未直接進行書籍分類,識別文本后仍需人工進行書籍分類,故該發明在實際使用中具有很大的局限性。
發明內容
為克服上述現有技術中存在的不足,本發明提供了一種基于封面的書籍類型深度學習分類方法,該方法可能夠靠、準確地對書籍進行分類。
為解決上述技術問題,本發明采取的技術方案為:
一種基于封面的書籍類型深度學習分類方法,包括以下步驟:
S1、收集圖書封面圖像并制作訓練數據集DTP;
S2、將訓練數據集DTP輸入深度學習模型并進行訓練;
S3、使用S2所得到的深度學習模型對書籍進行分類。
所述步驟S1中,操作步驟為:
S1a、收集大量圖書封面圖像,根據體裁進行將這些圖像分為30個類別并進行標注;
S1b、將所有的圖像調整到224×224的大小,得到圖像數據DP;
S1c、使用視覺應用編程接口對數據集進行文本提取,得到文本數據DT;
S1d、將圖像數據DP、文本數據DT和標注類別數據共同組成訓練數據集DTP。
所述步驟S2中,操作步驟為:
S2a、將訓練數據集DTP中的圖像數據DP輸入基于視覺的深度學習網絡;
S2b、將訓練數據集DTP中的文本數據DT輸入基于文本的深度學習網絡;
S2c、將兩個深度學習的輸出進行直接拼接合并,得到全連接層;
S2d、將全連接層的數據直接輸入softmax層進行分類;
S2e、使用梯度下降方法進行反向傳播,更新網絡參數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西三友和智慧信息技術股份有限公司,未經山西三友和智慧信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110103351.5/2.html,轉載請聲明來源鉆瓜專利網。





