[發(fā)明專利]一種基于布隆濾波器的圖書館系統(tǒng)知識推薦方法在審
| 申請?zhí)枺?/td> | 202210049269.3 | 申請日: | 2022-01-17 |
| 公開(公告)號: | CN114385922A | 公開(公告)日: | 2022-04-22 |
| 發(fā)明(設(shè)計)人: | 陳俊;張耀;吳秀華 | 申請(專利權(quán))人: | 上海阿法迪智能數(shù)字科技股份有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/903;G06F16/901 |
| 代理公司: | 常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) 32231 | 代理人: | 林琳 |
| 地址: | 200233 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 濾波器 圖書館 系統(tǒng) 知識 推薦 方法 | ||
本發(fā)明公開了一種基于布隆濾波器的圖書館系統(tǒng)知識推薦方法,包括步驟:一、確定用于圖書館系統(tǒng)知識推薦的布隆濾波器的整體結(jié)構(gòu)和參數(shù);所述參數(shù)包括布隆濾波器位數(shù)和哈希函數(shù)的個數(shù);二、對每本圖書/文獻,建立對應(yīng)的布隆濾波器結(jié)構(gòu),作為其屬性之一進行存儲;三、對每本圖書/文獻,根據(jù)布隆濾波器結(jié)構(gòu)判斷關(guān)聯(lián)性最大的前N本圖書/文獻;其中,N的取值為非0自然數(shù)。本發(fā)明不需要保存每本圖書/文獻的關(guān)鍵詞文字信息,只需要保存特定結(jié)構(gòu)的布隆濾波器信息,數(shù)據(jù)結(jié)構(gòu)固定;圖書/文獻相似度比較時不需要進行關(guān)鍵字匹配,只需要根據(jù)各自布隆濾波器之間按位比較,就可以判斷相似度,計算更加簡單高效,提高了推薦效率。
技術(shù)領(lǐng)域
本發(fā)明屬于圖書管理系統(tǒng)技術(shù)領(lǐng)域,具體涉及一種基于布隆濾波器的圖書館系統(tǒng)知識推薦方法。
背景技術(shù)
推薦技術(shù)發(fā)展由來已久,常用的推薦技術(shù)包括協(xié)同過濾推薦、基于知識的推薦等。其中協(xié)同過濾推薦又分為基于用戶的協(xié)同過濾和基于項目的協(xié)同過濾;基于知識的推薦根據(jù)對用戶需要的形式化表示進行推薦。已有的推薦技術(shù),在根據(jù)用戶歷史行為預(yù)測將來行為方面可以獲得很好的效果,其中協(xié)同過濾技術(shù)廣泛應(yīng)用于各類商業(yè)推薦系統(tǒng)中;基于知識的推薦系統(tǒng)更加側(cè)重某個細分領(lǐng)域的推薦,且需要專家知識的介入,適用于規(guī)模較小且規(guī)律較明顯的系統(tǒng)。
圖書館系統(tǒng)知識推薦系統(tǒng)中,重點在于怎樣根據(jù)圖書/文獻之間的相似度進行關(guān)聯(lián)程度的判斷。采用用戶歷史操作的方法需要記錄大量的用戶借閱/下載記錄,且存在用戶/項目的冷啟動問題;采用專家知識推薦的方法,可以將圖書/文獻按照圖書分類法進行大類劃分,但是這種劃分方式粒度太粗,對關(guān)聯(lián)圖書/文獻的推薦不夠準(zhǔn)確。
利用圖書/文獻的關(guān)鍵詞信息進行匹配查找,是一種比較容易想到的圖書/文獻關(guān)聯(lián)推薦方法,但是已有的利用關(guān)鍵詞的推薦方法,大多基于關(guān)鍵詞的字符串匹配,該方法存在以下兩點缺陷:1、需要記錄系統(tǒng)所有關(guān)鍵詞,記錄數(shù)量龐大,且格式不統(tǒng)一;2、需要對關(guān)鍵字逐個進行字符串匹配,計算開銷較大。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于針對上述現(xiàn)有技術(shù)中的不足,提供一種基于布隆濾波器的圖書館系統(tǒng)知識推薦方法,其不需要保存每本圖書/文獻的關(guān)鍵詞文字信息,只需要保存特定結(jié)構(gòu)的布隆濾波器信息,數(shù)據(jù)結(jié)構(gòu)固定;圖書/文獻相似度比較時不需要進行關(guān)鍵字匹配,只需要根據(jù)各自布隆濾波器之間按位比較,就可以判斷相似度,計算更加簡單高效,提高了推薦效率。
為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案是:一種基于布隆濾波器的圖書館系統(tǒng)知識推薦方法,該方法包括以下步驟:
步驟一、確定用于圖書館系統(tǒng)知識推薦的布隆濾波器的整體結(jié)構(gòu)和參數(shù);所述參數(shù)包括根據(jù)圖書館系統(tǒng)文獻的關(guān)鍵詞數(shù)量和布隆濾波器失誤率確定的布隆濾波器位數(shù),以及根據(jù)圖書館系統(tǒng)文獻的關(guān)鍵詞數(shù)量和布隆濾波器位數(shù)確定的用于將每個圖書館系統(tǒng)文獻的關(guān)鍵詞信息映射到布隆濾波器中的哈希函數(shù)的個數(shù);
步驟二、對每本圖書/文獻,建立對應(yīng)的布隆濾波器結(jié)構(gòu),作為其屬性之一進行存儲;
步驟三、對每本圖書/文獻,根據(jù)布隆濾波器結(jié)構(gòu)判斷關(guān)聯(lián)性最大的前N本圖書/文獻;其中,N的取值為非0自然數(shù)。
上述的一種基于布隆濾波器的圖書館系統(tǒng)知識推薦方法,步驟三之后還包括步驟四、從關(guān)聯(lián)性最大的前N本圖書/文獻中,去除用戶在時間段T內(nèi)已借閱過的圖書/文獻。
上述的一種基于布隆濾波器的圖書館系統(tǒng)知識推薦方法,步驟一中所述布隆濾波器位數(shù)采用公式確定,單位為bit;步驟一種所述哈希函數(shù)的個數(shù)采用公式確定;其中,m為布隆濾波器位數(shù),k為哈希函數(shù)的個數(shù),n為圖書館系統(tǒng)文獻的關(guān)鍵詞數(shù)量,p為布隆濾波器失誤率。
上述的一種基于布隆濾波器的圖書館系統(tǒng)知識推薦方法,步驟一中所述哈希函數(shù)包括非加密型哈希函數(shù)murmur hash。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海阿法迪智能數(shù)字科技股份有限公司,未經(jīng)上海阿法迪智能數(shù)字科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210049269.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





