[發(fā)明專利]科研信息演化的分析方法和裝置有效
| 申請?zhí)枺?/td> | 201310522710.6 | 申請日: | 2013-10-29 |
| 公開(公告)號: | CN103605671B | 公開(公告)日: | 2017-01-11 |
| 發(fā)明(設(shè)計)人: | 徐碩;史慶偉;喬曉東;朱禮軍 | 申請(專利權(quán))人: | 中國科學(xué)技術(shù)信息研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市立方律師事務(wù)所11330 | 代理人: | 鄭瑜生 |
| 地址: | 100038*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 科研 信息 演化 分析 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及科研信息分析的技術(shù)領(lǐng)域,尤其是涉及科研信息演化的分析方法和裝置。?
背景技術(shù)
科研文獻作為學(xué)術(shù)成果的主要載體,凝聚了科研人員的大量汗水和智慧,是人類社會中傳播知識、進行學(xué)術(shù)交流的重要手段,任何科學(xué)研究的成果都是建立在之前的科學(xué)研究的基礎(chǔ)之上的。普賴斯科研文獻指數(shù)增長定律和邏輯曲線增長模型表明:科研文獻的數(shù)量正呈指數(shù)級增長。為了準確把握科技發(fā)展現(xiàn)狀,可以結(jié)合科研文獻的特征信息,從海量的科研文獻中找出科技主題及其內(nèi)部的發(fā)展脈絡(luò)。其中,科研文獻資源包含大量的特征信息,例如單詞與單詞之間的潛在語義關(guān)系、科研文獻主題與作者的關(guān)系(作者的研究興趣)、研究熱點的興起、成熟到衰退的過程等。?
在現(xiàn)有技術(shù)中,Rosen-Zvi等人在LDA模型中引入作者隱變量,用作者-主題(Author-Topic,AT)分布取代LDA模型中的科研文獻-主題分布。AT模型可以有效地挖掘科研文獻的作者與科研文獻的主題之間的聯(lián)系,找出科研人員的研究興趣。然而,AT模型隱式地假設(shè)每個科研人員只有一個研究興趣,為克服這一限制條件,Mimno等人在AT模型的基礎(chǔ)上構(gòu)建了作者-身份-主題(Author-Persona-Topic,APT)模型。該模型將科研人員的“身份”(Persona)與研究興趣相對應(yīng),并給出了一種估計研究興趣個數(shù)的啟發(fā)式方法。然而,AT和APT模型在挖掘科研人員的研究興趣時,都是只考慮了其撰寫的科研文獻,而均未直接考慮時間因素的影響,所以無法揭示科研文獻的主題、科研人員的研究興趣隨時間變化的規(guī)律。?
發(fā)明內(nèi)容
本發(fā)明提供一種科研信息演化的分析方法和裝置,用于解決現(xiàn)有技術(shù)中不能揭示科研文獻的主題、科研人員的研究興趣隨時間變化的規(guī)律的問題。?
為解決現(xiàn)有技術(shù)中的上述問題,本發(fā)明提供了一種科研信息演化的分析方法,其中,包括:?
通過采集單元采集預(yù)設(shè)領(lǐng)域的二篇以上科研文獻;?
通過預(yù)處理單元對所述科研文獻進行預(yù)處理,并構(gòu)建所述二篇以上科研文獻的作者主題演化模型;?
通過獲取單元設(shè)定科研信息估算參數(shù),利用演化運算公式運算所述科研估算參數(shù),以獲取科研信息演化結(jié)果。?
本發(fā)明還提供了一種科研信息演化的分析裝置,其中包括:采集單元、預(yù)處理單元和獲取單元;?
所述采集單元用于采集預(yù)設(shè)領(lǐng)域的二篇以上科研文獻;?
所述預(yù)處理單元用于對所述科研文獻的進行預(yù)處理,并構(gòu)建所述二篇以上科研文獻的作者主題演化模型;?
所述獲取單元用于設(shè)定科研信息估算參數(shù),利用演化運算公式運算所述科研估算參數(shù),以獲取科研信息演化結(jié)果。?
本發(fā)明提供的實施例的有益效果:?
在本實施例中,采集預(yù)設(shè)領(lǐng)域的二篇以上科研文獻,對科研文獻進行預(yù)處理,并構(gòu)建二篇以上科研文獻的作者主題演化模型,設(shè)定科研信息估算參數(shù),利用演化運算公式運算科研估算參數(shù),以獲取科研信息演化結(jié)果,科研信息演化結(jié)果在揭示科研文獻的主題、科研人員的研究興趣的同時,也能揭示挖掘預(yù)設(shè)科研領(lǐng)域科研的主題、科研人員的研究興趣等隨時間變化的規(guī)律,有助于把握預(yù)設(shè)領(lǐng)域內(nèi)科研主題的演化脈絡(luò)。?
附圖說明
本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:?
圖1為本發(fā)明科研信息演化的分析方法第一實施例的流程圖;?
圖2為本發(fā)明科研信息演化的分析方法第二實施例的流程圖;?
圖3為本實施例中AToT模型的概率圖;?
圖4為本實施例中主題“增強學(xué)習(xí)”隨時間變化的趨勢圖;?
圖5為本實施例中主題“EM和混合模型”隨時間變化的趨勢圖;?
圖6為本實施例中主題“眼睛識別及因子分析”隨時間變化的趨勢圖;?
圖7為本實施例中主題“數(shù)據(jù)模型及學(xué)習(xí)算法”隨時間變化的趨勢圖;?
圖8為本實施例中主題“支持向量機和核方法”隨時間變化的趨勢圖;?
圖9為本實施例中主題“神經(jīng)網(wǎng)絡(luò)”隨時間變化的趨勢圖;?
圖10為本實施例中主題“語音識別”隨時間變化的趨勢圖;?
圖11為本實施例中主題“貝葉斯學(xué)習(xí)”隨時間變化的趨勢圖;?
圖12為本實施例中科研文獻的時間分布圖;?
圖13為本實施例中科研人員研究主題的時間演化模型圖;?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)技術(shù)信息研究所,未經(jīng)中國科學(xué)技術(shù)信息研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310522710.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 一種軟件體系結(jié)構(gòu)并行演化沖突的檢測方法
- 基于Agent的動態(tài)演化系統(tǒng)及方法
- 粒子刻蝕或沉積演化仿真方法、裝置和計算機可讀介質(zhì)
- 一種基于Petri網(wǎng)的Web服務(wù)組合演化方法
- 一種基于演化切片的演化影響集預(yù)測方法
- 一種挖掘重疊社區(qū)動態(tài)演化關(guān)聯(lián)規(guī)則的方法
- 一種智能電網(wǎng)發(fā)電側(cè)微分演化博弈競價方法
- 基于混合結(jié)構(gòu)的指揮控制超網(wǎng)絡(luò)動態(tài)演化模型構(gòu)建方法
- 一種基于頭腦風(fēng)暴優(yōu)化算法求解演化博弈問題的方法
- 基于演化變點的社會網(wǎng)絡(luò)演化分析方法





