[發(fā)明專利]基于書脊視覺信息的圖書識別方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011383651.5 | 申請日: | 2020-12-01 |
| 公開(公告)號: | CN112560902A | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設計)人: | 孫坦;周碩;柴秀娟;張文蓉;鮮國建 | 申請(專利權)人: | 中國農(nóng)業(yè)科學院農(nóng)業(yè)信息研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京律誠同業(yè)知識產(chǎn)權代理有限公司 11006 | 代理人: | 祁建國 |
| 地址: | 100081 北京市海淀區(qū)*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 書脊 視覺 信息 圖書 識別 方法 系統(tǒng) | ||
1.一種基于書脊視覺信息的圖書識別方法,其特征在于,包括:
步驟1、獲取已標注書脊分割的圖書書脊圖片作為訓練集,通過該訓練集訓練用于分割書脊的深度卷積神經(jīng)網(wǎng)絡模型,得到書脊分割模型,使用該書脊分割模型,對采集的架上書本圖片做實例分割,得到多張書脊圖片;
步驟2、通過為每張書脊圖片標注圖書類別,構建書脊分類數(shù)據(jù)集,通過該書脊分類數(shù)據(jù)集訓練用于書脊分類的深度卷積神經(jīng)網(wǎng)絡模型,得到書脊特征提取模型,使用該書脊特征提取模型提取圖書數(shù)據(jù)庫中每一本書的書脊視覺特征,集合書脊視覺特征構建書脊視覺數(shù)據(jù)庫;
步驟3、將包含多個書脊的待識別書脊圖片輸入至書脊分割模型進行實例分割,并將分割結果輸入至該書脊特征提取模型,得到該待識別書脊圖片中各書脊的視覺特征向量,將該視覺特征向量與數(shù)據(jù)庫匹配以識別該待識別書脊圖片中各書脊的圖書類別。
2.如權利要求1所述的基于書脊視覺信息的圖書識別方法,其特征在于,該步驟1包括數(shù)據(jù)集構建步驟,使用圖片采集設備對架上圖書進行多角度拍攝,并在拍攝結果中每個書脊區(qū)域確定四個坐標點(xN,yN)i,N∈[1,4]構成一個封閉的四邊形bi將其框選,以標注書脊分割。
3.如權利要求1所述的基于書脊視覺信息的圖書識別方法,其特征在于,該步驟2包括圖書類別標注步驟,獲得圖書書脊圖片中所有的書脊區(qū)域Bi,獲取書脊區(qū)域Bi的最小外接矩形Ri的四個頂點(XN,YN)i,N∈[1,4]以及Ri長邊的傾斜角度θi,將原圖進行仿射變換旋轉θi后再根據(jù)(XN,YN)i,N∈[1,4]裁切得到規(guī)整的書脊圖片BEi,人工對書脊圖片BEi標注類別標簽,其中同一本書的書脊圖片擁有相同的標簽。
4.如權利要求1所述的基于書脊視覺信息的圖書識別方法,其特征在于,該步驟2中用于書脊分類的深度卷積神經(jīng)網(wǎng)絡模型的構建方法包括:使用殘差模塊構建多層的深度卷積神經(jīng)網(wǎng)絡作為特征提取網(wǎng)絡m2,特征提取網(wǎng)絡m2末端添加一個使用加性角度間隔損失函數(shù)的全連接分類層classifier,得到該用于書脊分類的深度卷積神經(jīng)網(wǎng)絡模型的結構;
該步驟2包括使用該書脊分類數(shù)據(jù)集,按照分類任務的范式訓練模型M2=m2+classifier:輸入縮放為固定大小的書脊圖片,訓練輸出書脊圖片所屬標簽,M2訓練完成以后將模型中特征提取網(wǎng)絡m2輸出的特征圖Fi作為書脊的視覺特征向量。
5.如權利要求4所述的基于書脊視覺信息的圖書識別方法,其特征在于,該步驟3包括將該待識別書脊圖片送入該書脊分割模型中處理,得到該待識別書脊圖片中所有圖書的書脊圖片BEi;在識別過程中,使用余弦相似度度量兩個書脊視覺表征向量Fa=[a1,a2,…,a512]與Fb=[b1,b2,…,b512]之間的相似程度;書脊特征提取模型m2計算每一個書脊圖片BEi的視覺表征Fi,將其與脊視覺數(shù)據(jù)庫中的數(shù)據(jù)做最近鄰搜索,得到脊視覺數(shù)據(jù)庫中與目標書脊圖片相似度最高的多個書脊類別id信息,其中相似度最高的類別id信息作為最終識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農(nóng)業(yè)科學院農(nóng)業(yè)信息研究所,未經(jīng)中國農(nóng)業(yè)科學院農(nóng)業(yè)信息研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011383651.5/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





