[發(fā)明專利]一種基于學(xué)術(shù)大數(shù)據(jù)的論文影響力預(yù)測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810474777.X | 申請(qǐng)日: | 2018-05-17 |
| 公開(公告)號(hào): | CN108764546B | 公開(公告)日: | 2021-04-13 |
| 發(fā)明(設(shè)計(jì))人: | 白曉梅;張福利;李季;韓祿;那艷 | 申請(qǐng)(專利權(quán))人: | 鞍山師范學(xué)院 |
| 主分類號(hào): | G06Q10/04 | 分類號(hào): | G06Q10/04;G06F30/20 |
| 代理公司: | 遼寧鴻文知識(shí)產(chǎn)權(quán)代理有限公司 21102 | 代理人: | 楊植 |
| 地址: | 114007 遼*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 學(xué)術(shù) 數(shù)據(jù) 論文 影響力 預(yù)測(cè) 方法 | ||
一種基于學(xué)術(shù)大數(shù)據(jù)的論文影響力預(yù)測(cè)方法,該方法利用點(diǎn)估計(jì)的預(yù)測(cè)模型預(yù)測(cè)論文影響力,其關(guān)鍵點(diǎn)在于根據(jù)論文引用量?jī)?nèi)在演化機(jī)制進(jìn)行建模。給定一批學(xué)術(shù)數(shù)據(jù),基于點(diǎn)估計(jì)的論文影響力預(yù)測(cè)模型的目的是在已有模型的基礎(chǔ)上,通過分析驅(qū)動(dòng)論文引用量演化的因素,擴(kuò)展已有模型使之能夠有效地預(yù)測(cè)論文未來的引用量。基于點(diǎn)估計(jì)的論文影響力預(yù)測(cè)模型需要滿足以下三個(gè)性質(zhì):衰減性、增量性以及保持性。該方法利用論文之間的引用關(guān)系,提出了擴(kuò)展的Hawkes過程對(duì)論文影響力進(jìn)行預(yù)測(cè),并給出了相應(yīng)的實(shí)現(xiàn)方法,具有很強(qiáng)的前瞻性,該模型較不考慮早期引用作者影響力的點(diǎn)估計(jì)模型和science上發(fā)表的論文影響力預(yù)測(cè)模型有更高的準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明涉及學(xué)術(shù)領(lǐng)域中基于學(xué)術(shù)大數(shù)據(jù)對(duì)論文影響力進(jìn)行預(yù)測(cè)的方法,尤其涉及一種基于點(diǎn)估計(jì)模型的論文影響力預(yù)測(cè)方法。
背景技術(shù)
科研領(lǐng)域的快速發(fā)展使得論文的數(shù)量以指數(shù)級(jí)別增加,對(duì)科研資金資助對(duì)象、高校招募新成員而言,論文潛在的影響力比量化論文過去的影響力更有指導(dǎo)意義。因此一種有效的論文影響力預(yù)測(cè)方法對(duì)學(xué)習(xí)和科研都有重要的幫助。但是至今為止所提出的如基于隨機(jī)森林算法預(yù)測(cè)、基于貝葉斯算法預(yù)測(cè)都存在一些已知的問題,不能滿足對(duì)預(yù)測(cè)準(zhǔn)確度的要求,準(zhǔn)確度更高的預(yù)測(cè)方法有待科研人員進(jìn)一步去探索。
發(fā)明內(nèi)容
本發(fā)明的目的主要針對(duì)現(xiàn)有研究的一些不足之處,提出基于學(xué)術(shù)大數(shù)據(jù)的論文影響力預(yù)測(cè)方法,該方法利用點(diǎn)估計(jì)的預(yù)測(cè)模型預(yù)測(cè)論文影響力,其關(guān)鍵點(diǎn)在于根據(jù)論文引用量?jī)?nèi)在演化機(jī)制進(jìn)行建模。給定一批學(xué)術(shù)數(shù)據(jù),基于點(diǎn)估計(jì)的論文影響力預(yù)測(cè)模型的目的是在已有模型的基礎(chǔ)上,通過分析驅(qū)動(dòng)論文引用量演化的因素,擴(kuò)展已有模型使之能夠有效地預(yù)測(cè)論文未來的引用量。基于點(diǎn)估計(jì)的論文影響力預(yù)測(cè)模型需要滿足以下三個(gè)性質(zhì):衰減性、增量性以及保持性。該方法利用論文之間的引用關(guān)系,提出了擴(kuò)展的Hawkes過程對(duì)論文影響力進(jìn)行預(yù)測(cè),并給出了相應(yīng)的實(shí)現(xiàn)方法,具有很強(qiáng)的前瞻性,為論文影響力的預(yù)測(cè)提供一種新方法。
本發(fā)明的技術(shù)方案:
一種基于學(xué)術(shù)大數(shù)據(jù)的論文影響力預(yù)測(cè)方法,步驟如下:
(1)依據(jù)論文固有的潛力、論文影響力隨時(shí)間的衰減、早期引用者影響力的特征以及早期引用量進(jìn)行建模
1.1)分析論文固有的潛力:每篇論文都有它潛在的影響力,而決定論文固有的潛力的關(guān)鍵因素就是作者影響力;一篇論文固有的潛力通過作者影響力Q值來刻畫;當(dāng)作者的Q值高于1時(shí),對(duì)論文影響力具有提升作用;當(dāng)作者的Q值低于1時(shí),其能夠降低論文的影響力,
1.2)論文影響力隨時(shí)間的衰減:新穎的想法會(huì)被后續(xù)的研究借鑒,每篇論文的新穎度最終會(huì)褪色;
1.3)早期引用作者的影響力:先前的研究者在建模引用動(dòng)態(tài)模型時(shí)忽略了引用作者的影響力。我們?cè)谡撐挠绊懥︻A(yù)測(cè)模型中考慮了早期引用作者的影響力。早期引用作者的影響力對(duì)論文的引用量起到正面作用。
1.4)早期引用量。論文在早期的引用量越多,論文在之后便可能獲得更多的引用量。
1.5)基于上述與論文影響力變化相關(guān)的特征進(jìn)行點(diǎn)估計(jì)建模,一篇學(xué)術(shù)論文的潛在被引用的強(qiáng)度定義如下:
其中,β是論文質(zhì)量系數(shù);QdMax表示一篇論文署名作者中,論文影響力最大的作者的影響力;是時(shí)間衰減函數(shù),表示隨著時(shí)間的推移,論文的影響力是逐漸衰減的;αd表示一篇論文引用影響的系數(shù);j表示一篇論文;Dj表示隨著時(shí)間的變化,早期引用作者的影響力;表示目前引用量衰減的值;
Q值公式如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鞍山師范學(xué)院,未經(jīng)鞍山師范學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810474777.X/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 一種用學(xué)術(shù)術(shù)語導(dǎo)航網(wǎng)絡(luò)學(xué)術(shù)資源的方法
- 一種學(xué)術(shù)指數(shù)體系及其發(fā)布方法
- 學(xué)術(shù)資料搜索方法和裝置
- 一種基于用戶行為的學(xué)術(shù)資源推薦方法
- 加權(quán)學(xué)術(shù)績(jī)效考核方法及系統(tǒng)
- 學(xué)術(shù)項(xiàng)目推薦
- 用于學(xué)術(shù)會(huì)議的學(xué)術(shù)報(bào)告管理方法和管理系統(tǒng)
- 一種醫(yī)學(xué)術(shù)語系統(tǒng)的構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 醫(yī)學(xué)術(shù)語標(biāo)準(zhǔn)化方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種適用于標(biāo)準(zhǔn)醫(yī)學(xué)術(shù)語的驗(yàn)證系統(tǒng)及方法
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





