[發明專利]一種基于深度學習與質量影響的圖書檢索方法有效
| 申請號: | 202110208083.3 | 申請日: | 2021-02-25 |
| 公開(公告)號: | CN112948544B | 公開(公告)日: | 2022-03-29 |
| 發明(設計)人: | 劉澳;畢家澤;陳祎瓊;張瑋;姚越 | 申請(專利權)人: | 安徽農業大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F16/383;G06F40/30;G06F40/194;G06N3/04;G06N3/08 |
| 代理公司: | 合肥中谷知識產權代理事務所(普通合伙) 34146 | 代理人: | 洪玲 |
| 地址: | 230000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 質量 影響 圖書 檢索 方法 | ||
本發明涉及一種基于深度學習與質量影響的圖書檢索方法,包括以下步驟:1)、獲取數字圖書館數據庫中的數據并提取其中的標準化書名數據和內容關鍵詞句數據,采用類別噪聲裁剪算法將提取的數據進行降噪處理;2)、基于深度學習模型對上述步驟1)中降噪處理后的數據進行特征提取和分類并得到圖書的語義類信息;3)、基于步驟2)中獲取的語義類信息建立語義理解索引數據庫。該基于深度學習與質量影響的圖書檢索方法,可以更好的理解用戶真正的檢索需求,利用深度學習技術提高了搜索的精細化程度,在保證搜索語義相似度的基礎上引入了圖書質量識別模型,使得用戶在圖書館搜索引擎時最終接收到的結果語義相似度高,同時也保證了圖書的質量。
技術領域
本發明屬于自然語言處理技術領域,具體涉及一種基于深度學習與質 量影響的圖書檢索方法。
背景技術
傳統的圖書館搜索引擎對自然語言的理解能力有所欠缺,不符合人們 檢索問題的慣性思維,對于用戶輸入的檢索的字段只能采用機械式的關鍵 詞匹配。
而且由于文學作品通常含有人類感情,具有特殊性,利用傳統關鍵字 提取算法方法無法準確獲取到真正有意義的文章特征,同時,在傳統圖書 館搜索引擎中對用戶結果僅僅考慮了相似度排序,并未考慮圖書質量,導 致搜索結果的精細化程度較低。
發明內容
本發明的目的就在于為了解決上述問題而提供一種結構簡單,設計合 理的一種基于深度學習與質量影響的圖書檢索方法。
本發明通過以下技術方案來實現上述目的:
一種基于深度學習與質量影響的圖書檢索方法,包括以下步驟:
1)、獲取數字圖書館數據庫中的數據并提取其中的標準化書名數據和 內容關鍵詞句數據,采用類別噪聲裁剪算法將提取的數據進行降噪處理;
2)、基于深度學習模型對上述步驟1)中降噪處理后的數據進行特征 提取和分類并得到圖書的語義類信息;
3)、基于步驟2)中獲取的語義類信息建立語義理解索引數據庫,并 映射到數字圖書館數據庫上;
4)、獲取用戶輸入的檢索信息,并進行文本預處理;
5)、基于深度學習模型對步驟4)中經文本預處理后的檢索信息進行 關鍵字提?。?/p>
6)、基于深度文本匹配模型將步驟5)中提取的關鍵字與步驟3)中 建立的語義理解索引數據庫進行對比,將對比結果按相似度從高到低排序, 截取前n個對比結果形成圖書檢索結果R1;
7)、建立基于模糊模式的圖書質量識別模型,根據圖書質量識別模型 對步驟6)中的圖書檢索結果R1的n個對比結果進行模糊模式的質量識別, 并按照質量識別結果得分從高到低排序,形成圖書檢索結果R2;
8)、根據可信度計算公式計算圖書檢索結果R2的可信度r,
其中,b=0.4,Sij是R2中第i本書第j個指標得分,是R2中第i本書 第j個指標在同類圖書中的平均得分,wj是圖書第j個評價指標的權重, 可信度的判斷值CD的范圍為0-0.4;
9)、基于步驟6)中的圖書檢索結果R1、步驟7)中的圖書檢索結果 R2以及步驟8)中獲得的可信度r構造層次結構模型并利用層次結構模型 重新歸納整理圖書排序結果,得到圖書檢索結果R3;
10)、將圖書檢索結果R3返回至用戶,完成基于深度學習的圖書檢索 過程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽農業大學,未經安徽農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110208083.3/2.html,轉載請聲明來源鉆瓜專利網。





