[發(fā)明專利]一種基于多維度的學(xué)術(shù)文獻(xiàn)推薦方法有效
| 申請?zhí)枺?/td> | 202110405315.4 | 申請日: | 2021-04-15 |
| 公開(公告)號: | CN113268683B | 公開(公告)日: | 2023-05-16 |
| 發(fā)明(設(shè)計)人: | 胥備;陶蒙蒙 | 申請(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/906;G06F16/9535;G06F40/194;G06F40/242;G06F40/284 |
| 代理公司: | 南京經(jīng)緯專利商標(biāo)代理有限公司 32200 | 代理人: | 田凌濤 |
| 地址: | 210000 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多維 學(xué)術(shù) 文獻(xiàn) 推薦 方法 | ||
1.一種基于多維度的學(xué)術(shù)文獻(xiàn)推薦方法,基于目標(biāo)用戶各篇已閱讀文獻(xiàn)與各篇收藏文獻(xiàn)構(gòu)成的各篇參照文獻(xiàn),向目標(biāo)用戶實現(xiàn)各篇未閱讀文獻(xiàn)的推薦,其特征在于,包括如下步驟:
步驟A.基于目標(biāo)用戶的各篇參照文獻(xiàn)、以及各篇未閱讀文獻(xiàn),構(gòu)建文獻(xiàn)集合,并基于指定百科詞條的圖狀結(jié)構(gòu)分布,構(gòu)建指定各專業(yè)領(lǐng)域分別所對應(yīng)的概念從屬樹,然后進(jìn)入步驟B;
步驟B.分別針對文獻(xiàn)集合中的各篇文獻(xiàn),結(jié)合文獻(xiàn)所屬專業(yè)領(lǐng)域?qū)?yīng)概念從屬樹中的各個詞條,以及預(yù)設(shè)停用詞庫,針對文獻(xiàn)進(jìn)行分詞切割,獲得文獻(xiàn)所包含的各個分詞,進(jìn)而獲得文獻(xiàn)集合中各篇文獻(xiàn)分別所包含的各個分詞,然后進(jìn)入步驟C;
步驟C.分別針對文獻(xiàn)集合中的各篇文獻(xiàn),基于文獻(xiàn)所包含的各個分詞,統(tǒng)計獲得該文獻(xiàn)所對應(yīng)的各個非重復(fù)分詞,并進(jìn)一步分別針對該各個非重復(fù)分詞,獲得非重復(fù)分詞在文獻(xiàn)集合中對于該文獻(xiàn)的重要程度值,作為該文獻(xiàn)中該非重復(fù)分詞的重要指標(biāo)值;進(jìn)而獲得文獻(xiàn)集合中各篇文獻(xiàn)分別所對應(yīng)各非重復(fù)分詞的重要指標(biāo)值,然后進(jìn)入步驟D;
步驟D.分別針對文獻(xiàn)集合中的各篇文獻(xiàn),進(jìn)一步分別針對文獻(xiàn)所對應(yīng)的各個非重復(fù)分詞,根據(jù)該文獻(xiàn)中非重復(fù)分詞的重要指標(biāo)值,結(jié)合該非重復(fù)分詞在該文獻(xiàn)中的預(yù)設(shè)權(quán)重、以及該非重復(fù)分詞對應(yīng)該文獻(xiàn)所屬專業(yè)領(lǐng)域的概念從屬樹中的詞條層次,通過三者的乘積,獲得該文獻(xiàn)中該非重復(fù)分詞的權(quán)值,其中,若該非重復(fù)分詞未與該文獻(xiàn)所屬專業(yè)領(lǐng)域概念從屬樹中的詞條相對應(yīng),則定義該非重復(fù)分詞對應(yīng)該文獻(xiàn)所屬專業(yè)領(lǐng)域的概念從屬樹中的詞條層次為1;進(jìn)而獲得文獻(xiàn)集合中各篇文獻(xiàn)分別所對應(yīng)各非重復(fù)分詞的權(quán)值,然后進(jìn)入步驟E;
步驟E.分別針對文獻(xiàn)集合中的各篇文獻(xiàn),針對文獻(xiàn)所對應(yīng)的各個非重復(fù)分詞,按所對應(yīng)權(quán)值由大至小順序進(jìn)行排序,并按由第一個非重復(fù)分詞起依次選取A個非重復(fù)分詞,作為該文獻(xiàn)所對應(yīng)的各個特征關(guān)鍵分詞;進(jìn)而獲得文獻(xiàn)集合中各篇文獻(xiàn)分別對應(yīng)的各個特征關(guān)鍵分詞,然后進(jìn)入步驟F;其中,K表示文獻(xiàn)所對應(yīng)非重復(fù)分詞的數(shù)量,a表示預(yù)設(shè)取數(shù)比例,表示向上取整;
步驟F.分別針對文獻(xiàn)集合中的各篇文獻(xiàn),根據(jù)文獻(xiàn)所對應(yīng)各特征關(guān)鍵分詞的權(quán)值、以及各特征關(guān)鍵分詞的排序,構(gòu)建該文獻(xiàn)所對應(yīng)的特征詞權(quán)值向量,進(jìn)而獲得文獻(xiàn)集合中各篇文獻(xiàn)分別所對應(yīng)的特征詞權(quán)值向量,然后進(jìn)入步驟G;
步驟G.分別針對文獻(xiàn)集合中的各篇未閱讀文獻(xiàn),根據(jù)文獻(xiàn)集合中各篇文獻(xiàn)分別所對應(yīng)的特征詞權(quán)值向量,獲得未閱讀文獻(xiàn)分別與各篇參照文獻(xiàn)之間的語義相似度,并應(yīng)用平均語義相似度作為該未閱讀文獻(xiàn)所對應(yīng)的語義相似度;進(jìn)而獲得各篇未閱讀文獻(xiàn)分別所對應(yīng)的語義相似度,構(gòu)成一種文本篩選維度,然后進(jìn)入步驟H;
步驟H.基于預(yù)設(shè)各用戶等級分別所對應(yīng)各種文本篩選維度對應(yīng)關(guān)系,根據(jù)目標(biāo)用戶所對應(yīng)的用戶等級,選擇滿足該用戶等級下各種文本篩選維度對應(yīng)關(guān)系的各篇未閱讀文獻(xiàn),用于推薦給目標(biāo)用戶。
2.根據(jù)權(quán)利要求1所述一種基于多維度的學(xué)術(shù)文獻(xiàn)推薦方法,其特征在于:基于所述步驟D獲得文獻(xiàn)集合中各篇文獻(xiàn)分別所對應(yīng)各非重復(fù)分詞的權(quán)值后,步驟E至步驟G執(zhí)行的同時,還包括如下步驟i1至步驟i2;
步驟i1.分別針對文獻(xiàn)集合中的各篇文獻(xiàn),獲得文獻(xiàn)所對應(yīng)各非重復(fù)分詞中、與該文獻(xiàn)所屬專業(yè)領(lǐng)域概念從屬樹中詞條相對應(yīng)的各個非重復(fù)分詞,作為該文獻(xiàn)所對應(yīng)的各個領(lǐng)域特征分詞;進(jìn)而獲得文獻(xiàn)集合中各篇文獻(xiàn)分別所對應(yīng)的各個領(lǐng)域特征分詞,然后進(jìn)入步驟i2;
步驟i2.分別針對文獻(xiàn)集合中的各篇未閱讀文獻(xiàn),進(jìn)一步分別針對未閱讀文獻(xiàn)與各篇參照文獻(xiàn)之間,基于兩篇文獻(xiàn)同屬相同專業(yè)領(lǐng)域的情形下,判斷該兩篇文獻(xiàn)分別所對應(yīng)各個領(lǐng)域特征分詞之間是否存在相同的領(lǐng)域特征分詞,是則基于相同領(lǐng)域特征分詞分別在該兩篇文獻(xiàn)中權(quán)值的乘積,應(yīng)用各相同領(lǐng)域特征分詞分別所對應(yīng)乘積之和,作為該兩篇文獻(xiàn)之間的領(lǐng)域相似度,否則其余情形下該兩篇文獻(xiàn)之間的領(lǐng)域相似度為0,進(jìn)而獲得該未閱讀文獻(xiàn)分別與各篇參照文獻(xiàn)之間的領(lǐng)域相似度,并應(yīng)用平均領(lǐng)域相似度作為該未閱讀文獻(xiàn)所對應(yīng)的領(lǐng)域相似度;進(jìn)而獲得各篇未閱讀文獻(xiàn)分別所對應(yīng)的領(lǐng)域相似度,構(gòu)成一種文本篩選維度,然后進(jìn)入步驟H。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110405315.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種用學(xué)術(shù)術(shù)語導(dǎo)航網(wǎng)絡(luò)學(xué)術(shù)資源的方法
- 一種學(xué)術(shù)指數(shù)體系及其發(fā)布方法
- 學(xué)術(shù)資料搜索方法和裝置
- 一種基于用戶行為的學(xué)術(shù)資源推薦方法
- 加權(quán)學(xué)術(shù)績效考核方法及系統(tǒng)
- 學(xué)術(shù)項目推薦
- 用于學(xué)術(shù)會議的學(xué)術(shù)報告管理方法和管理系統(tǒng)
- 一種醫(yī)學(xué)術(shù)語系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲介質(zhì)
- 醫(yī)學(xué)術(shù)語標(biāo)準(zhǔn)化方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種適用于標(biāo)準(zhǔn)醫(yī)學(xué)術(shù)語的驗證系統(tǒng)及方法
- PDF科技文獻(xiàn)管理系統(tǒng)及其方法
- 建立新舊文獻(xiàn)代替關(guān)系的方法及裝置
- 一種自動標(biāo)注文獻(xiàn)作廢的方法和裝置
- 一種新型的中文科技文獻(xiàn)半自動標(biāo)引方法
- 文獻(xiàn)歸一方法、文獻(xiàn)搜索方法及對應(yīng)裝置
- 文獻(xiàn)價值評估方法和裝置
- 一種基于引用次數(shù)的文獻(xiàn)推薦方法
- 一種多語種文獻(xiàn)分類方法、裝置及存儲介質(zhì)
- 一種文獻(xiàn)標(biāo)簽的識別方法及裝置
- 一種基于文檔數(shù)據(jù)分析的在線文獻(xiàn)歸納和儲存系統(tǒng)





