[發明專利]一種基于機器學習的圖文融合圖書推薦方法在審
| 申請號: | 201811606384.6 | 申請日: | 2018-12-26 |
| 公開(公告)號: | CN109766465A | 公開(公告)日: | 2019-05-17 |
| 發明(設計)人: | 王子豪;牟書念;李興亮;孫曉燕 | 申請(專利權)人: | 中國礦業大學 |
| 主分類號: | G06F16/53 | 分類號: | G06F16/53;G06F16/9535;G06K9/62 |
| 代理公司: | 南京正聯知識產權代理有限公司 32243 | 代理人: | 鄧道花 |
| 地址: | 22100*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 預處理 融合 基于機器 圖片特征 圖書推薦 圖文 向量 采集 卷積神經網絡 圖書館檢索 余弦相似度 圖書文本 圖文數據 圖像特征 圖像文本 圖像向量 文本特征 文本轉化 線性集成 協同過濾 緯度 降維 權重 學習 分類 衡量 網絡 圖片 | ||
本發明涉及圖書館檢索技術領域,具體地說,是一種基于機器學習的圖文融合圖書推薦方法,包括以下步驟:采集圖書相關數據并進行預處理,從網絡上采集圖書圖文數據并進行預處理;提取圖書圖片特征,利用DCNN和VGG?16深度卷積神經網絡對于ImageNet2012中的126萬張圖片進行訓練,從而得到較為準確的訓練權重,利用其提取圖片特征,并對其進行降維;提取圖書文本特征,使用RNN和Word2Vec框架將文本轉化為與圖像向量緯度一致的向量,圖像特征與文本特征的融合,設計線性集成方法對于圖像文本向量進行融合;實現推薦,利用余弦相似度方法對其進行衡量,并計算分類閾值,結合傳統基于物品的協同過濾的推薦方法進行推薦。
技術領域
本發明涉及圖書館檢索技術領域,具體地說,是一種基于機器學習的圖文融合圖書推薦方法。
背景技術
現如今計算機網絡技術發展越來越廣泛傳統圖書館模式以及不能滿足大眾的需求了,使得圖書館在新形勢下將軟件、硬件各方面都進行了創新改革并迅速發展起來。信息資源作為人們生活中不可缺少的重要資源,呈現出了前所未有的增長,服務機構的增多使得信息方面的獲取更加的廣泛,人們在知識的需求上更加的多樣和急切,人們在知識的獲取方式上一直在改變。致使信息資源的增長以及信息利用的困難越來越明顯,所以圖書館要提供新的服務方式,也就是個性化服務,只有個性化服務才能在根本上改變圖書館整體的局面。
高校圖書館的個性化服務是針對高校師生在科研以及教學上進行不同方式的一種服務,它具有層次性、特色性以及專業性。高校圖書館服務的對象都是具有一定專業知識的教師、學生或者科研人員,個性化服務的出發點是能夠使用戶滿意,并且主動服務的基本模式。
傳統高校圖書館因為是使用館藏文獻來為師生以及科研進行服務的,在查詢以及篩選上都費時費力,需要消耗大量的人力。隨著網絡技術的發展壯大,使得高校圖書館的的使用更加的便捷化、準確化。以網絡服務為中心的個性化服務將會成為整個時代發展的必然走向。而且,網絡環境下的圖書館不僅在于圖書館里的藏書有多少,更在乎圖書館提供的實質性信息有多少,準確性有多少和用戶使用上的滿意程度。圖書館個性服務從根本上將自己的服務功能進行了提升。
發明內容
為了解決上述技術問題,為圖書館尤其是學校圖書館提供一種精準的圖書推薦方法,本發明披露了一種基于機器學習的圖文融合圖書推薦方法,其具體技術方案如下:
一種精準的圖書推薦方法,包括如下步驟:
步驟一、采集圖書相關數據并進行預處理:從網絡上采集圖書圖文數據并進行預處理;
步驟二、提取圖書圖片特征:利用DCNN和VGG-16深度卷積神經網絡對于ImageNet2012中的126萬張圖片進行訓練,從而得到較為準確的訓練權重,利用其提取圖片特征,并對其進行降維;
步驟三、提取圖書文本特征:使用RNN和Word2Vec框架將文本轉化為與圖像向量緯度一致的向量;
步驟四、圖像特征與文本特征的融合:設計線性集成方法對于圖像文本向量進行融合;
步驟五、實現推薦:利用余弦相似度方法對其進行衡量,并計算分類閾值,結合傳統基于物品的協同過濾的推薦方法進行推薦。
本發明的進一步改進,在步驟一中采用基于requests庫和beautifulsoup 庫的網絡爬蟲采集圖書的圖片和文本數據,并進行過濾,以此作為數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國礦業大學,未經中國礦業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811606384.6/2.html,轉載請聲明來源鉆瓜專利網。





