[發(fā)明專利]一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210049269.3 | 申請(qǐng)日: | 2022-01-17 |
| 公開(公告)號(hào): | CN114385922A | 公開(公告)日: | 2022-04-22 |
| 發(fā)明(設(shè)計(jì))人: | 陳俊;張耀;吳秀華 | 申請(qǐng)(專利權(quán))人: | 上海阿法迪智能數(shù)字科技股份有限公司 |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535;G06F16/903;G06F16/901 |
| 代理公司: | 常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) 32231 | 代理人: | 林琳 |
| 地址: | 200233 上海市徐匯*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 濾波器 圖書館 系統(tǒng) 知識(shí) 推薦 方法 | ||
1.一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法,其特征在于:該方法包括以下步驟:
步驟一、確定用于圖書館系統(tǒng)知識(shí)推薦的布隆濾波器的整體結(jié)構(gòu)和參數(shù);所述參數(shù)包括根據(jù)圖書館系統(tǒng)文獻(xiàn)的關(guān)鍵詞數(shù)量和布隆濾波器失誤率確定的布隆濾波器位數(shù),以及根據(jù)圖書館系統(tǒng)文獻(xiàn)的關(guān)鍵詞數(shù)量和布隆濾波器位數(shù)確定的用于將每個(gè)圖書館系統(tǒng)文獻(xiàn)的關(guān)鍵詞信息映射到布隆濾波器中的哈希函數(shù)的個(gè)數(shù);
步驟二、對(duì)每本圖書/文獻(xiàn),建立對(duì)應(yīng)的布隆濾波器結(jié)構(gòu),作為其屬性之一進(jìn)行存儲(chǔ);
步驟三、對(duì)每本圖書/文獻(xiàn),根據(jù)布隆濾波器結(jié)構(gòu)判斷關(guān)聯(lián)性最大的前N本圖書/文獻(xiàn);其中,N的取值為非0自然數(shù)。
2.按照權(quán)利要求1所述的一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法,其特征在于:步驟三之后還包括步驟四、從關(guān)聯(lián)性最大的前N本圖書/文獻(xiàn)中,去除用戶在時(shí)間段T內(nèi)已借閱過的圖書/文獻(xiàn)。
3.按照權(quán)利要求1或2所述的一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法,其特征在于:步驟一中所述布隆濾波器位數(shù)采用公式確定,單位為bit;步驟一種所述哈希函數(shù)的個(gè)數(shù)采用公式確定;其中,m為布隆濾波器位數(shù),k為哈希函數(shù)的個(gè)數(shù),n為圖書館系統(tǒng)文獻(xiàn)的關(guān)鍵詞數(shù)量,p為布隆濾波器失誤率。
4.按照權(quán)利要求1或2所述的一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法,其特征在于:步驟一中所述哈希函數(shù)包括非加密型哈希函數(shù)murmur hash。
5.按照權(quán)利要求1或2所述的一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法,其特征在于:步驟二中所述對(duì)每本圖書/文獻(xiàn),建立對(duì)應(yīng)的布隆濾波器結(jié)構(gòu),作為其屬性之一進(jìn)行存儲(chǔ)的具體方法為:將將每本圖書/文獻(xiàn)的每個(gè)關(guān)鍵詞,用步驟一中的多個(gè)哈希函數(shù)分別哈希,并將該圖書/文獻(xiàn)所有關(guān)鍵詞的哈希結(jié)果按位異或存儲(chǔ)到該圖書/文獻(xiàn)對(duì)應(yīng)的布隆濾波器結(jié)構(gòu)中。
6.按照權(quán)利要求1或2所述的一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法,其特征在于:步驟三中所述對(duì)每本圖書/文獻(xiàn),根據(jù)布隆濾波器結(jié)構(gòu)判斷關(guān)聯(lián)性最大的前N本圖書/文獻(xiàn)的具體方法為:對(duì)某本圖書/文獻(xiàn),將其布隆濾波器結(jié)構(gòu)和其他圖書/文獻(xiàn)的布隆濾波器結(jié)構(gòu)依次進(jìn)行按位異或操作,異或操作之后,布隆濾波器結(jié)構(gòu)中1的個(gè)數(shù)作為兩本圖書/文獻(xiàn)的相似度評(píng)判值,遍歷所有圖書/文獻(xiàn),找到相似度評(píng)判值最高的前N本圖書/文獻(xiàn),作為該圖書/文獻(xiàn)的關(guān)聯(lián)圖書/文獻(xiàn)。
7.按照權(quán)利要求1或2所述的一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法,其特征在于:所述N的取值為10~60的非0自然數(shù)。
8.按照權(quán)利要求2所述的一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法,其特征在于:步驟四中所述從關(guān)聯(lián)性最大的前N本圖書/文獻(xiàn)中,去除用戶在時(shí)間段T內(nèi)已借閱過的圖書/文獻(xiàn)的具體方法為:
步驟401、用戶每借閱過一本圖書/文獻(xiàn),就將該圖書/文獻(xiàn)存儲(chǔ)在已借閱數(shù)組中,且沒隔時(shí)間段T清零一次;
步驟402、將已借閱數(shù)組中的圖書/文獻(xiàn),分別通過hash函數(shù)計(jì)算形成多個(gè)哈希表;
步驟403、將關(guān)聯(lián)性最大的前N本圖書/文獻(xiàn)進(jìn)行hash函數(shù)計(jì)算得到計(jì)算結(jié)果;
步驟404、將步驟403中的計(jì)算結(jié)果與步驟402中的多個(gè)哈希表進(jìn)行匹配,當(dāng)匹配成功時(shí),判斷為圖書/文獻(xiàn)在時(shí)間段T內(nèi)被用戶借閱過,去除推薦;否則,當(dāng)匹配不成功時(shí),判斷為圖書/文獻(xiàn)在時(shí)間段T內(nèi)未被用戶借閱過,繼續(xù)推薦。
9.按照權(quán)利要求8所述的一種基于布隆濾波器的圖書館系統(tǒng)知識(shí)推薦方法,其特征在于:所述時(shí)間段T為1~6個(gè)月。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海阿法迪智能數(shù)字科技股份有限公司,未經(jīng)上海阿法迪智能數(shù)字科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210049269.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





