[發明專利]一種基于多屬性特征的文章推薦方法有效
| 申請號: | 202110418032.3 | 申請日: | 2021-04-19 |
| 公開(公告)號: | CN113158041B | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 蔡世民;賀小雨;陳明仁 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/284;G06F16/33;G06K9/62;G06N3/08 |
| 代理公司: | 電子科技大學專利中心 51203 | 代理人: | 陳一鑫 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 屬性 特征 文章 推薦 方法 | ||
該發明公開了一種基于多屬性特征的文章推薦方法,屬于信息處理領域。用多屬性文章特征的推薦方法,提取更多文章特征,提升推薦性能:利用基于文章引文網絡的struc2vec嵌入向量,基于帶有文章作者、機構信息的異構網絡的metapath2vec嵌入向量,文章標題、摘要內容doc2vec的嵌入向量,在原引文網絡的基礎上,通過重構圖的方法,該方法能夠按照權重結合同構引文網絡、異構文章網絡、文本信息的嵌入結果。對于多屬性特征的重構網絡,使用能夠結合結構信息和同質信息的方法進行圖嵌入,提升推薦性能:通過node2vec方法得到文章節點含有結構信息和同質信息的嵌入向量,最終通過向量相似度進行推薦。
技術領域
本發明屬于信息處理領域,特別是涉及基于文本特征、引文網絡特征、異構網絡特征的學術文章推薦方法。
背景技術
引文網絡:引文網絡是由學術文章作為節點構成的圖,若兩篇學術文章之間有引用關系,則將兩個節點連邊;引文網絡為G(E,V),vi∈V表示文章vi在數據集之中,若eij∈E則表示文章vi、vj有引用關系;這里的引用關系連邊eij是無向的,也就是說不區分是文章vi被文章vj引用還是文章vj被文章vi引用。
異構網絡:對于圖G(E,V)來說,如果節點集V中的點分為不同的類型,且不同類型的點存在連邊,則這個圖就是異構圖,也叫異構網絡。
帶有文章作者、機構信息的異構網絡:G′(V′,E′,T),其中V′=V1∪V2∪V3,V1為機構節點集合,V2為作者節點集合,V3為文章節點集合,T代表不同節點類型的集合,T={1,2,3},E′表示邊的集合,簡稱邊集。
含有多屬性特征的引文網絡:結合每篇文章的多種特征,在原引文網絡的基礎上重構的網絡。
連通圖:兩個節點連通指的是兩個節點間存在路徑,連通圖G(E,V)滿足任意兩個不同的頂點vi和vj都連通。
連通分量:無向圖G(E,V)的連通分量是一個子圖,此子圖是連通圖,但子圖中所有頂點和子圖以外的其他頂點不連通。
圖嵌入:是一種把整個圖或者圖里面的節點映射成向量的方法。
文本表征:是自然語言處理領域中,將文本映射為向量的方法。
字符串:將多個字符存儲成數組的數據結構。
子串:屬于字符串的一部分,由任意個連續的字符組成,稱為該串的子串。
特征:指的是代表圖中節點或文章的向量。
節點的度:在圖G(E,V)中,頂點vi的度是此頂點有邊的條數,即deg(vi)=||K||,K={eij|eij∈E,vj∈V}。
隨機游走:也稱隨機漫步,在圖中,指的是對于某個節點,基于此節點到其他節點的轉移概率,隨機生成一條路徑。
上下文(context)序列:隨機游走生成的路徑,也叫序列。
相似度:向量的相似程度的數量表示。直觀上看,將多個文章表示為向量,通過兩個向量的相似性則可以進行推薦。相似度的度量指標有歐幾里得距離、余弦相似度等。
推薦列表:對每一篇文章,生成的一個含有和它若干篇相似文章的列表,其中相似文章按照相似度降序排列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110418032.3/2.html,轉載請聲明來源鉆瓜專利網。





