[發(fā)明專(zhuān)利]一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010528034.3 | 申請(qǐng)日: | 2020-06-11 |
| 公開(kāi)(公告)號(hào): | CN111694930A | 公開(kāi)(公告)日: | 2020-09-22 |
| 發(fā)明(設(shè)計(jì))人: | 侯穎;崔運(yùn)鵬;劉娟 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所 |
| 主分類(lèi)號(hào): | G06F16/33 | 分類(lèi)號(hào): | G06F16/33;G06F16/335;G06F16/34;G06F16/35 |
| 代理公司: | 北京德崇智捷知識(shí)產(chǎn)權(quán)代理有限公司 11467 | 代理人: | 申星宇 |
| 地址: | 100081 北京市海淀區(qū)中關(guān)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 動(dòng)態(tài) 知識(shí) 熱點(diǎn) 演化 趨勢(shì) 分析 方法 | ||
1.一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法,其特征在于:
包括以下步驟:
S10用戶(hù)根據(jù)需求收集文獻(xiàn)元數(shù)據(jù),并輸出或形成以制表符分隔且編碼格式為UTF-8的包含標(biāo)題、摘要等字段的記錄文件;
S20對(duì)導(dǎo)出的文獻(xiàn)元數(shù)據(jù)進(jìn)行預(yù)處理工作;
S30選取預(yù)處理后文獻(xiàn)元數(shù)據(jù)的摘要和出版年份,進(jìn)行潛在主題的動(dòng)態(tài)建模分析及文獻(xiàn)主題的偏好計(jì)算得到熱點(diǎn)單詞;
S40對(duì)所述熱點(diǎn)單詞的主題聚類(lèi)進(jìn)行可視化,顯示與每個(gè)主題每個(gè)年份最相關(guān)的熱點(diǎn)單詞;
S50對(duì)主題中熱點(diǎn)單詞的變化趨勢(shì)進(jìn)行可視化:用戶(hù)選取主題中感興趣的單詞,通過(guò)曲線(xiàn)圖顯示該單詞在時(shí)間序列上的變化趨勢(shì)。
2.根據(jù)權(quán)利要求1所述的一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法,其特征在于,收集文獻(xiàn)元數(shù)據(jù)主要包括標(biāo)題、摘要、出版年份等字段,文件存儲(chǔ)格式為制表符分隔、UTF-8編碼的csv或txt純文本類(lèi)型,數(shù)據(jù)集可以從Web of Science核心數(shù)據(jù)庫(kù)導(dǎo)出對(duì)應(yīng)的格式,或者為符合格式要求的其他自定義數(shù)據(jù)集。
3.根據(jù)權(quán)利要求1所述的一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法,其特征在于,所述預(yù)處理工作包括刪除無(wú)效元數(shù)據(jù)、完成詞干化、去停用詞、清除無(wú)意義字符和識(shí)別短語(yǔ)步驟。
4.根據(jù)權(quán)利要求1所述的一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法,其特征在于,所述主題建模分析采用變分推斷來(lái)近似后驗(yàn)分布。該方法基于如下假設(shè):
1)數(shù)據(jù)按時(shí)間片劃分;
2)與時(shí)間片t相關(guān)聯(lián)的主題從與時(shí)間片t-1相關(guān)聯(lián)的主題演變而來(lái);
3)每個(gè)時(shí)間片使用K分量主題模型對(duì)文檔建模。
5.根據(jù)權(quán)利要求1所述的一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法,其特征在于,所述熱點(diǎn)單詞的主題聚類(lèi)進(jìn)行可視化是對(duì)模型分析結(jié)果中熱點(diǎn)單詞的顯示,按照主題分類(lèi)顯示各個(gè)時(shí)間片(如年份)的熱點(diǎn)單詞,單詞按照模型分析結(jié)果的概率大小順序顯示。
6.根據(jù)權(quán)利要求1所述的一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法,其特征在于,所述可視化方法具體步驟如下:
1)獲取用戶(hù)選擇的熱點(diǎn)單詞;
2)基于接收到的第一交互指令,對(duì)所述主題動(dòng)態(tài)建模分析結(jié)果中的熱點(diǎn)單詞信息進(jìn)行附加圖示計(jì)算,所述圖示包括等值點(diǎn);基于所述主題動(dòng)態(tài)建模分析結(jié)果中的熱點(diǎn)單詞信息渲染獲得對(duì)應(yīng)的相位點(diǎn)值;
3)基于接收到的第二交互指令,在所述柵格圖形上連接多個(gè)所述相位點(diǎn)渲染所述附加圖示獲得曲線(xiàn)趨勢(shì)圖形。
7.根據(jù)權(quán)利要求1或4所述的一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法,其特征在于,所述主題動(dòng)態(tài)建模分別以5、10、15、20、25不同的主題數(shù)量計(jì)算coherence值,以獲得最佳的主題數(shù)量。
8.根據(jù)權(quán)利要求1或4所述的一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法,其特征在于,所述主題動(dòng)態(tài)建模中分析時(shí)間片t上的序列語(yǔ)料的生成過(guò)程如下:
1)根據(jù)βt|β(t-1)~N(β(t-1),δ2I)生成時(shí)間片t上的主題-詞匯概率分布βt;
2)根據(jù)αt|α(t-1)~N(α(t-1),δ2I)生成時(shí)間片t上的先驗(yàn)主題先驗(yàn)分布αt;
3)對(duì)于時(shí)間片t上的每一篇文章d,根據(jù)η~N(αt,a2I)生成時(shí)間片t上的文檔-主題概率分布η;
4)對(duì)于文檔d中的每一個(gè)單詞n,根據(jù)Z~Mult(π(η))生成詞-主題分配標(biāo)識(shí)向量Z;根據(jù)W(t,d,n)~Mult(π(βt,z))生成詞W(t,d,n)。
9.根據(jù)權(quán)利要求1所述的一種動(dòng)態(tài)知識(shí)熱點(diǎn)演化及趨勢(shì)分析方法,其特征在于,所述主題動(dòng)態(tài)建模分析文獻(xiàn)或所述偏好計(jì)算使用的近似變分后驗(yàn)公式為:
上述變分方法優(yōu)化潛在變量(主題βt,k,混合比例θt,d和主題指標(biāo)Zt,d,n)上分布的參數(shù)。在{βk,1,...,βk,T}變分分布中,通過(guò)設(shè)置具有高斯“變分觀測(cè)值”的動(dòng)態(tài)模型保留主題的順序結(jié)構(gòu)。文檔級(jí)潛在變量的變分分布中,每個(gè)比例向量θt,d被賦予自由Dirichlet參數(shù)γt,d;主題指標(biāo)Zt,d,n被賦予自由多項(xiàng)式參數(shù)Φt,d,n。使用共軛梯度法來(lái)優(yōu)化主題級(jí)變分觀測(cè),由此得到的自然主題參數(shù){βk,1,...,βk,T}的變分近似結(jié)合了時(shí)間動(dòng)態(tài)。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,未經(jīng)中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010528034.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 動(dòng)態(tài)矢量譯碼方法和動(dòng)態(tài)矢量譯碼裝置
- 動(dòng)態(tài)口令的顯示方法及動(dòng)態(tài)令牌
- 動(dòng)態(tài)庫(kù)管理方法和裝置
- 動(dòng)態(tài)令牌的身份認(rèn)證方法及裝置
- 令牌、動(dòng)態(tài)口令生成方法、動(dòng)態(tài)口令認(rèn)證方法及系統(tǒng)
- 一種動(dòng)態(tài)模糊控制系統(tǒng)
- 一種基于動(dòng)態(tài)信號(hào)的POS機(jī)和安全保護(hù)方法
- 圖像動(dòng)態(tài)展示的方法、裝置、系統(tǒng)及介質(zhì)
- 一種基于POS機(jī)聚合碼功能分離顯示動(dòng)態(tài)聚合碼的系統(tǒng)
- 基于動(dòng)態(tài)口令的身份認(rèn)證方法、裝置和動(dòng)態(tài)令牌
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 使用多機(jī)器學(xué)習(xí)核的光刻熱點(diǎn)檢測(cè)
- 一種釣魚(yú)熱點(diǎn)的檢測(cè)方法及系統(tǒng)
- 一種基于大數(shù)據(jù)識(shí)別釣魚(yú)熱點(diǎn)的方法和設(shè)備
- 一種快速分享熱點(diǎn)的方法及設(shè)備
- 一種信息獲取的方法、設(shè)備以及介質(zhì)
- 一種熱點(diǎn)切換的方法及設(shè)備
- 熱點(diǎn)開(kāi)啟方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 熱點(diǎn)區(qū)域定位方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種城市交通出行問(wèn)題熱點(diǎn)分級(jí)方法及裝置
- 一種基于無(wú)線(xiàn)熱點(diǎn)實(shí)現(xiàn)定位的方法與設(shè)備
- 一種軟件體系結(jié)構(gòu)并行演化沖突的檢測(cè)方法
- 基于Agent的動(dòng)態(tài)演化系統(tǒng)及方法
- 粒子刻蝕或沉積演化仿真方法、裝置和計(jì)算機(jī)可讀介質(zhì)
- 一種基于Petri網(wǎng)的Web服務(wù)組合演化方法
- 一種基于演化切片的演化影響集預(yù)測(cè)方法
- 一種挖掘重疊社區(qū)動(dòng)態(tài)演化關(guān)聯(lián)規(guī)則的方法
- 一種智能電網(wǎng)發(fā)電側(cè)微分演化博弈競(jìng)價(jià)方法
- 基于混合結(jié)構(gòu)的指揮控制超網(wǎng)絡(luò)動(dòng)態(tài)演化模型構(gòu)建方法
- 一種基于頭腦風(fēng)暴優(yōu)化算法求解演化博弈問(wèn)題的方法
- 基于演化變點(diǎn)的社會(huì)網(wǎng)絡(luò)演化分析方法





