[發明專利]面向綜合集成研討環境的主題實時影響力評演方法及系統有效
| 申請號: | 202010195669.6 | 申請日: | 2020-03-19 |
| 公開(公告)號: | CN111427999B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 鄭楠;王丹力;戴汝為 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/34;G06F40/284;G06F40/289;G06Q10/0639 |
| 代理公司: | 北京市恒有知識產權代理事務所(普通合伙) 11576 | 代理人: | 郭文浩;尹文會 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 綜合 集成 研討 環境 主題 實時 影響力 方法 系統 | ||
1.一種面向綜合集成研討環境的主題實時影響力評演方法,其特征在于,所述評演方法包括:
根據研討廳中專家的當前發言內容,生成當前研討的主題;
根據專家發言之間的回復關系,構建發言消息網絡;
基于發言消息網絡,計算發言消息的影響力;
根據發言消息的影響力及消息的發布時間,計算所述主題的時效影響力;
根據主題影響力的時效性,確定主題的實時演化情況;
所述根據研討廳中專家的當前發言內容,生成當前研討的主題,具體包括:
對所述當前發言內容進行預處理,得到預處理文本;
將預處理文本按照發言時間分為N段,得到N個子文本;
采用主題生成模型,對各子文本進行處理,生成對應子文本的主題,具體包括:通過詞條將所述子文本中的發言消息映射到相應主題;采用三層貝葉斯概率模型,計算各主題的詞頻;根據各主題的詞頻,確定所述子文本的主題;
所述詞頻包括:詞條wi對主題zj的詞條概率P(zj|wi)及主題zj對發言消息dm的消息概率P(zj|dm);
根據以下公式,計算各主題的詞頻:
其中,|zj|是發言集合中屬于主題zj的發言數目,dm為發言消息;P(zi=j)為第j個主題屬于當前發言的概率,P(wi|zi=j)為詞條wi屬于主題j的概率;
令φ(j)=P(wi|zi=j)表示主題j在詞條wi上的多項式分布,θ(i)=P(z)表示發言d在主題上的多項式分布;參數φ和θ表示詞條與主題,主題與發言的關聯關系;T表示主題數目,CWT和CDT分別表示W×T和D×T維的計數矩陣,表示不包括當前詞條wi的分配給主題j的詞條計數,表示不包括當前詞條wi且主題j分配給發言d中相應詞條的計數,表示不包括當前詞條w的分配給主題j的詞條計數,表示不包括當前詞條wi且主題t分配給發言d中相應詞條的計數,表示不包括當前詞條i的分配給主題j的詞條計數,表示不包括當前詞條k的分配給主題j的詞條計數,W為詞條的數目,D為發言的數目;
所述根據各主題的詞頻,確定所述子文本的主題,具體包括:
分別比較詞條概率P(zj|wi)與設定閾值THj、消息概率P(zj|dm)與設定閾值THj;
選擇大于所述設定閾值THj的詞條概率P(zj|wi)對應的詞條及大于所述設定閾值THj的消息概率P(zj|dm)對應的發言消息;
根據選擇出的詞條及發言消息,確定子文本的主題;
所述基于發言消息網絡,計算發言消息的影響力,具體包括:
通過社交網絡的入度特征分析方法,計算發言的數量要素量:
其中,發言消息網絡Gn為有向帶權圖,Gn=(Vn,En,Wn),節點集合Vn表示消息集合;邊集合En表示專家之間的回復關系;權重集合Wn表示在時間tn內回復的頻率,du、dv表示發言信息,Wn(dv,du)表示在時間tn內發言信息dv與發言信息du的回復頻率;
通過社交網絡的出度特征分析方法,計算發言的范圍要素量:
其中,I(dv,du)為指示函數,表示發言信息dv與發言信息du是否存在關聯;
根據所述發言的數量要素量及范圍要素量,確定當前發言信息du的影響力Sn(du):
其中,Nw和NI為歸一化常量,平滑因子α1決定數量要素量及范圍要素量在當前發明消息影響力Sn(du)中所占權重;
所述根據發言消息的影響力及消息的發布時間,計算所述主題的時效影響力,具體包括:
根據選擇出的發言消息,確定時間段tn內屬于主題zj的消息列表表示選擇出的發言消息,n表示時間劃段的段號,n=1,2,…,N;
根據選擇出的發言消息,計算所述主題zj的時效影響力Sn(zj):
其中,an表示時效權重,與發布的時間段tn相關,λ為預先設定的參考量,取值為0≤λ≤1,表示發言信息的影響力;
所述根據主題影響力的時效性,確定主題的實時演化方向,具體包括:
計算任意相鄰時間段的兩個時序主題的相似度sim(zj,zj+1):
其中,zj,zj+1為相鄰時間段的兩個時序主題,且對應的起始時間s(zj)<s(zj+1);P(wi|zj)為詞條wi屬于主題zj的概率;
比較所述相似度sim(zj,zj+1)與預先設定的相似度閾值ε大小:
當sim(zj,zj+1)>ε時,則確定zj與zj+1之間發生了時序主題轉換,且zj+1從zj演化而來,表示為
當sim(zj,zj+1)≤ε時,則確定zj與zj+1為相同的時序主題;
將所檢測到的時序主題轉換情況沿時間方向組合,得到主題演化網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010195669.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于頻率改進的聚類方法
- 下一篇:一種標簽的印刷上料裝置及標簽的生產工藝





