[發(fā)明專利]一種面向?qū)W術(shù)精準(zhǔn)推薦的異質(zhì)科研信息集成方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202110732872.7 | 申請(qǐng)日: | 2021-06-30 |
| 公開(kāi)(公告)號(hào): | CN113343125B | 公開(kāi)(公告)日: | 2023-08-22 |
| 發(fā)明(設(shè)計(jì))人: | 張凱;王楚豫;葉保留 | 申請(qǐng)(專利權(quán))人: | 南京大學(xué) |
| 主分類號(hào): | G06F16/9536 | 分類號(hào): | G06F16/9536;G06N3/0475;G06N3/0464;G06N3/094;G06N3/084;G06F18/22 |
| 代理公司: | 南京泉為知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 32408 | 代理人: | 許丹丹 |
| 地址: | 210023 江蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 學(xué)術(shù) 精準(zhǔn) 推薦 科研 信息 集成 方法 系統(tǒng) | ||
本發(fā)明公開(kāi)了一種面向?qū)W術(shù)精準(zhǔn)推薦的異質(zhì)科研信息集成方法及系統(tǒng),所述方法包括:對(duì)原始科研信息進(jìn)行預(yù)處理,將異質(zhì)的學(xué)術(shù)文獻(xiàn)信息編碼成向量模式,并構(gòu)造隨機(jī)異質(zhì)的科研信息;對(duì)學(xué)術(shù)信息特征向量和異質(zhì)科研信息進(jìn)行編碼,并構(gòu)建學(xué)術(shù)編碼映射模型;利用映射模型中的生成器,實(shí)現(xiàn)異質(zhì)學(xué)術(shù)信息到完整科研特征向量的轉(zhuǎn)化;將作者信息編碼成稀疏的獨(dú)熱向量,并標(biāo)記與科研特征向量的相關(guān)程度;利用獨(dú)熱向量、科研特征向量以及二者相關(guān)程度,訓(xùn)練協(xié)同過(guò)濾推薦模型,生成與作者相關(guān)的推薦集合;融合兩種推薦結(jié)果,完成學(xué)術(shù)文獻(xiàn)的精準(zhǔn)推薦。本發(fā)明通過(guò)特征內(nèi)容的比對(duì)和對(duì)作者的協(xié)同過(guò)濾,實(shí)現(xiàn)了異質(zhì)科研信息補(bǔ)全與融合,以及科研學(xué)術(shù)內(nèi)容的精準(zhǔn)推薦。
技術(shù)領(lǐng)域
本發(fā)明涉及學(xué)術(shù)數(shù)據(jù)推薦,具體涉及一種面向?qū)W術(shù)精準(zhǔn)推薦的異質(zhì)科研信息集成方法及系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,各種科研期刊與出版物也逐漸從紙質(zhì)媒介變成了在線存儲(chǔ)的電子媒介,并且可以通過(guò)科研數(shù)據(jù)庫(kù)等方式進(jìn)行在線檢索,為科研工作者提供了極大的便利。然而由于學(xué)術(shù)數(shù)據(jù)通常是由離散的個(gè)人或者組織自己產(chǎn)生,因此,不同的學(xué)術(shù)數(shù)據(jù)其結(jié)構(gòu)差別十分大,不同學(xué)術(shù)數(shù)據(jù)質(zhì)量參差不齊,異質(zhì)的學(xué)術(shù)數(shù)據(jù)造成學(xué)術(shù)推薦難以實(shí)現(xiàn)精準(zhǔn)定位;同一作者,同一論文在不同的網(wǎng)站,數(shù)據(jù)庫(kù)的標(biāo)注版本等有著較大的偏差,并且對(duì)于已經(jīng)上傳的數(shù)據(jù),往往也不同程度的存在一些信息缺失,造成海量的異質(zhì)學(xué)術(shù)數(shù)據(jù),這些給科研檢索以及相關(guān)學(xué)術(shù)推薦帶來(lái)了巨大的困難。因此,如何對(duì)異質(zhì)學(xué)術(shù)數(shù)據(jù)進(jìn)行集成與融合,使得構(gòu)造統(tǒng)一的學(xué)術(shù)信息結(jié)構(gòu)是學(xué)術(shù)推薦的關(guān)鍵。
不同于傳統(tǒng)的數(shù)據(jù)信息,學(xué)術(shù)數(shù)據(jù)往往需要更加細(xì)化的分類,才能實(shí)現(xiàn)精準(zhǔn)的推薦,即使對(duì)于同領(lǐng)域的研究?jī)?nèi)容,不同的用戶往往具有不同的傾向。例如,對(duì)于某一領(lǐng)域的初學(xué)者而言,綜述類型以及科普類型的學(xué)術(shù)文獻(xiàn)能夠幫助快速了解領(lǐng)域知識(shí);而對(duì)于深入該領(lǐng)域的研究專家而言,則需要推薦更加精深、專業(yè)性更強(qiáng)的學(xué)術(shù)文獻(xiàn)。因此,基于學(xué)術(shù)數(shù)據(jù)的精準(zhǔn)推薦不僅需要對(duì)文獻(xiàn)數(shù)據(jù)具有準(zhǔn)確的分類定位,也需要結(jié)合用戶的特征進(jìn)行推薦,才能實(shí)現(xiàn)更加精準(zhǔn)的推薦效果。
現(xiàn)有的科研信息推薦方法往往針對(duì)某一個(gè)信息源進(jìn)行推薦,未能很好的考慮到用戶對(duì)于異質(zhì)信息檢索的客觀需求。
發(fā)明內(nèi)容
針對(duì)上述現(xiàn)有技術(shù)的不足,為提升學(xué)術(shù)科研推薦系統(tǒng)的性能,本發(fā)明提供一種面向?qū)W術(shù)精準(zhǔn)推薦的異質(zhì)科研信息集成方法及集成系統(tǒng),利用生成式對(duì)抗學(xué)習(xí)與協(xié)同過(guò)濾的方法,針對(duì)異質(zhì)科研信息進(jìn)行處理,對(duì)于不同質(zhì)量的信息進(jìn)行細(xì)節(jié)補(bǔ)全,并對(duì)已有信息構(gòu)建比對(duì)信息庫(kù),以實(shí)現(xiàn)針對(duì)科研內(nèi)容與學(xué)者的精準(zhǔn)智能推薦。
為了達(dá)到上述目的,本發(fā)明采用如下技術(shù)方案:
根據(jù)本發(fā)明的第一方面,提供一種面向?qū)W術(shù)精準(zhǔn)推薦的異質(zhì)科研信息集成方法,包括以下步驟:
S1、對(duì)異質(zhì)的原始科研信息進(jìn)行預(yù)處理,包括:分別將異質(zhì)的學(xué)術(shù)文獻(xiàn)信息編碼成向量模式,并抽取語(yǔ)義相關(guān)的學(xué)術(shù)特征向量,用于編碼訓(xùn)練;并對(duì)學(xué)術(shù)特征向量的一些條目進(jìn)行隨機(jī)置空,構(gòu)造隨機(jī)異質(zhì)的科研信息;
S2、對(duì)于預(yù)處理獲得的學(xué)術(shù)信息特征向量和異質(zhì)科研信息進(jìn)行編碼,并構(gòu)建學(xué)術(shù)編碼映射模型,所述學(xué)術(shù)編碼映射模型利用多重卷積層構(gòu)建生成對(duì)抗網(wǎng)絡(luò),用于從異質(zhì)的科研信息中獲得完整特征向量的映射;
S3、利用生成對(duì)抗網(wǎng)絡(luò)的生成器部分,實(shí)現(xiàn)異質(zhì)學(xué)術(shù)信息到學(xué)術(shù)特征向量的轉(zhuǎn)化,將異質(zhì)、存在缺失條目的科研信息進(jìn)行補(bǔ)全并生成完整的科研信息特征向量;
S4、將作者信息編碼成稀疏的獨(dú)熱向量,并標(biāo)記作者信息獨(dú)熱向量與科研信息特征向量之間的相關(guān)程度;
S5、利用作者信息獨(dú)熱向量、科研信息特征向量以及作者信息獨(dú)熱向量與科研信息特征向量之間的相關(guān)程度,訓(xùn)練協(xié)同過(guò)濾推薦模型,用于生成與作者相關(guān)的推薦集合;
S6、融合基于協(xié)同過(guò)濾的作者—文獻(xiàn)相關(guān)性推薦以及基于生成對(duì)抗網(wǎng)絡(luò)的文獻(xiàn)—文獻(xiàn)相關(guān)性推薦,得到最終的推薦結(jié)果,完成學(xué)術(shù)文獻(xiàn)的精準(zhǔn)推薦。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京大學(xué),未經(jīng)南京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110732872.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種用學(xué)術(shù)術(shù)語(yǔ)導(dǎo)航網(wǎng)絡(luò)學(xué)術(shù)資源的方法
- 一種學(xué)術(shù)指數(shù)體系及其發(fā)布方法
- 學(xué)術(shù)資料搜索方法和裝置
- 一種基于用戶行為的學(xué)術(shù)資源推薦方法
- 加權(quán)學(xué)術(shù)績(jī)效考核方法及系統(tǒng)
- 學(xué)術(shù)項(xiàng)目推薦
- 用于學(xué)術(shù)會(huì)議的學(xué)術(shù)報(bào)告管理方法和管理系統(tǒng)
- 一種醫(yī)學(xué)術(shù)語(yǔ)系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 醫(yī)學(xué)術(shù)語(yǔ)標(biāo)準(zhǔn)化方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種適用于標(biāo)準(zhǔn)醫(yī)學(xué)術(shù)語(yǔ)的驗(yàn)證系統(tǒng)及方法





