[發(fā)明專利]一種基于深度學習與質(zhì)量影響的圖書檢索方法有效
| 申請?zhí)枺?/td> | 202110208083.3 | 申請日: | 2021-02-25 |
| 公開(公告)號: | CN112948544B | 公開(公告)日: | 2022-03-29 |
| 發(fā)明(設計)人: | 劉澳;畢家澤;陳祎瓊;張瑋;姚越 | 申請(專利權(quán))人: | 安徽農(nóng)業(yè)大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F16/383;G06F40/30;G06F40/194;G06N3/04;G06N3/08 |
| 代理公司: | 合肥中谷知識產(chǎn)權(quán)代理事務所(普通合伙) 34146 | 代理人: | 洪玲 |
| 地址: | 230000 *** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學習 質(zhì)量 影響 圖書 檢索 方法 | ||
1.一種基于深度學習與質(zhì)量影響的圖書檢索方法,其特征在于,包括以下步驟:
1)、獲取數(shù)字圖書館數(shù)據(jù)庫中的數(shù)據(jù)并提取其中的標準化書名數(shù)據(jù)和內(nèi)容關(guān)鍵詞句數(shù)據(jù),采用類別噪聲裁剪算法將提取的數(shù)據(jù)進行降噪處理;
2)、基于深度學習模型對上述步驟1)中降噪處理后的數(shù)據(jù)進行特征提取和分類并得到圖書的語義類信息;
3)、基于步驟2)中獲取的語義類信息建立語義理解索引數(shù)據(jù)庫,并映射到數(shù)字圖書館數(shù)據(jù)庫上;
4)、獲取用戶輸入的檢索信息,并進行文本預處理;
5)、基于深度學習模型對步驟4)中經(jīng)文本預處理后的檢索信息進行關(guān)鍵字提??;
6)、基于深度文本匹配模型將步驟5)中提取的關(guān)鍵字與步驟3)中建立的語義理解索引數(shù)據(jù)庫進行對比,將對比結(jié)果按相似度從高到低排序,截取前n個對比結(jié)果形成圖書檢索結(jié)果R1;
7)、建立基于模糊模式的圖書質(zhì)量識別模型,根據(jù)圖書質(zhì)量識別模型對步驟6)中的圖書檢索結(jié)果R1的n個對比結(jié)果進行模糊模式的質(zhì)量識別,并按照質(zhì)量識別結(jié)果得分從高到低排序,形成圖書檢索結(jié)果R2;
其中,建立基于模糊模式的圖書質(zhì)量識別模型具體包括:
71)確定質(zhì)量分類集G={G1,G2,G3,G4,G5}={好,較好,一般,較差,差},根據(jù)圖書數(shù)量n=50進行量化后得出G={50,40,30,20,10};
72)確定質(zhì)量評價指標集S={S1,S2,S3,S4,S5,S6},其中S1為DNN語言模型得分,S2為第三方網(wǎng)站1評分,S3為第三方網(wǎng)站2評分,S4為同類圖書借閱量評分,S5為同類圖書電機瀏覽量評分,S6為用戶評價情感得分;
73)確定圖書質(zhì)量分類對評價指標的模糊關(guān)系矩陣,將質(zhì)量評價指標按其重要程度劃分為五個等級,再對其進行歸一化處理;
74)將需識別圖書按1-9標度法對個評價指標進行標度并歸一化處理,得到模糊集A;
75)將得到的所述模糊集A與質(zhì)量分類{好,較好,一般,較差,差}的標度值分別用格貼近度N1(A,G)=(A·G)^(A×G)C、內(nèi)外積貼近度最大最小貼近度進行模糊計算,根據(jù)則近原則找到圖書歸屬類別;
8)、根據(jù)可信度計算公式計算圖書檢索結(jié)果R2的可信度r,
其中,b=0.4,Sij是R2中第i本書第j個指標得分,是R2中第i本書第j個指標在同類圖書中的平均得分,wj是圖書第j個評價指標的權(quán)重,可信度的判斷值CD的范圍為0-0.4;
9)、基于步驟6)中的圖書檢索結(jié)果R1、步驟7)中的圖書檢索結(jié)果R2以及步驟8)中獲得的可信度r構(gòu)造層次結(jié)構(gòu)模型并利用層次結(jié)構(gòu)模型重新歸納整理圖書排序結(jié)果,得到圖書檢索結(jié)果R3;
10)、將圖書檢索結(jié)果R3返回至用戶,完成基于深度學習的圖書檢索過程。
2.根據(jù)權(quán)利要求1所述的一種基于深度學習與質(zhì)量影響的圖書檢索方法,其特征在于:利用深度學習模型獲取圖書的語義類信息,具體為,基于skip-gram模型的詞嵌入表示方法獲得分布式詞向量,采用BiLSTM與Attention機制結(jié)合的方式進行文本分類,對輸出結(jié)果進行拼接并得到語義信息,再結(jié)合Attention機制在每一層給不同詞訓練不同的權(quán)重,加權(quán)得到不同句子對整段文本的語義影響程度并最終得到圖書的語義類信息。
3.根據(jù)權(quán)利要求1所述的一種基于深度學習與質(zhì)量影響的圖書檢索方法,其特征在于:所述步驟6)中n的數(shù)值為50。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽農(nóng)業(yè)大學,未經(jīng)安徽農(nóng)業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110208083.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





