[發明專利]一種話題獲取方法、終端、計算機可讀存儲介質有效
| 申請號: | 202010096076.4 | 申請日: | 2020-02-17 |
| 公開(公告)號: | CN111324725B | 公開(公告)日: | 2023-05-16 |
| 發明(設計)人: | 余正濤;彭仁杰;高盛祥;陳瑋;毛存禮;朱恩昌 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/33;G06F16/31 |
| 代理公司: | 昆明人從眾知識產權代理有限公司 53204 | 代理人: | 代轉嫚 |
| 地址: | 650093 云南省昆明*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 話題 獲取 方法 終端 計算機 可讀 存儲 介質 | ||
1.一種話題獲取方法,其特征在于,包括:
輸入目標文本;
根據預設話題模型得到所述目標文本的第一話題集合,所述第一話題集合包括至少一個話題詞;
對所述目標文本進行分析得到所述目標文本的第一事件要素集合,所述第一事件要素集合至少包括一個事件要素,所述事件要素是指所述目標文本對應的事件信息;
根據所述第一話題集合和所述第一事件要素集合得到滿足話題相關條件的第二話題集合;
計算所述第二話題集合和所述目標文本中的詞語的相關性,并計算所述第一事件要素集合與所述目標文本中詞語的相似度;
根據所述相關性和所述相似度對所述第二話題集合進行優化處理,得到目標話題集合;
所述根據所述第一話題集合和所述第一事件要素集合得到滿足話題相關條件的第二話題集合,包括:
根據所述第一話題集合和所述第一事件要素集合計算得到語義相似度,根據所述語義相似度過濾得到滿足話題相關條件的第二話題集合;
所述根據所述相關性和所述相似度對所述第二話題集合進行優化處理,得到目標話題集合,包括:
預設所述相關性的第一權重值和所述相似度的第二權重值;
根據所述第一權重值和第二權重值對所述相關性和所述相似度進行加權處理,得到所述第二話題集合中各個話題詞語對應的權重值;
按照從大到小的順序對所述權重值進行排序,根據排序結果選擇前N個權重值對應的話題詞作為目標話題集合。
2.如權利要求1所述的話題獲取方法,其特征在于,所述根據所述第一話題集合和所述第一事件要素集合計算得到語義相似度,根據所述語義相似度過濾得到滿足話題相關條件的第二話題集合,包括:
將所述第一話題集合和所述第一事件要素集合嵌入到向量空間中進行語義表征;
通過所述語義表征計算得到所述第一話題集合中各個話題詞語相應的語義相似度;
從所述第一話題集合中選取所述語義相似度滿足話題相關條件的話題詞作為第二話題集合。
3.如權利要求1-2任一項所述的話題獲取方法,其特征在于,所述計算所述第二話題集合和所述目標文本中的詞語的相關性,并計算所述第一事件要素集合與所述目標文本中的詞語的相似度,包括:
根據互信息計算得到所述第二話題集合和所述目標文本中的詞語的相關性;
利用詞嵌入將所述目標文本中的詞語和所述第一事件要素集合嵌入為詞級的向量空間表示,以計算得到所述第一事件要素集合與所述目標文本中的詞語的相似度。
4.如權利要求1所述的話題獲取方法,其特征在于,所述預設話題模型包括詞對主題模型BTM。
5.一種話題獲取裝置,其特征在于,包括用于執行如權利要求1-4任一權利要求所述的方法的模塊。
6.一種終端,其特征在于,包括處理器、通信接口、顯示屏和存儲器,所述處理器、通信接口、顯示屏和存儲器相互連接,其中,所述存儲器用于存儲計算機程序,所述計算機程序包括程序指令,所述處理器被配置用于調用所述程序指令,執行如權利要求1-4任一項所述的方法。
7.一種計算機可讀存儲介質,其特征在于,所述計算機存儲介質存儲有計算機程序,所述計算機程序包括程序指令,所述程序指令當被處理器執行時使所述處理器執行如權利要求1-4任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010096076.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于人工智能識別的影像處理系統
- 下一篇:一種分布式身份認證方法





