[發明專利]一種基于關聯語義鏈網絡的事件相關度計算方法有效
| 申請號: | 201910985738.0 | 申請日: | 2019-10-17 |
| 公開(公告)號: | CN110765777B | 公開(公告)日: | 2023-09-15 |
| 發明(設計)人: | 駱祥峰;黃敬;馬秀俠;陳雪 | 申請(專利權)人: | 上海大學;阿里巴巴集團控股有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/289 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 陸聰明 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 關聯 語義 網絡 事件 相關 計算方法 | ||
本發明公開了一種基于關聯語義鏈網絡的事件相關度計算方法。該方法具體步驟如下:(1)輸入領域中的任意兩個事件類文本集;(2)將每個事件類文本集表示為關聯語義鏈網絡;(3)計算事件在關鍵詞上的相關度;(4)計算事件在關聯關系上的相關度;(5)輸出事件的相關度。該方法以事件的關聯語義鏈網絡為相關度的參照物,關聯語義鏈網絡包括事件的關鍵詞及關鍵詞之間的關聯關系,關系具有權重。從共有關鍵詞和關聯關系兩個方面量化對參照物進行量化,以關聯語義鏈網絡的相關程度為相關度的衡量標準;該方法簡便易操作,效果好。
技術領域
本發明涉及一種事件的相關度計算方法,具體是一種基于關聯語義鏈網絡的事件相關度計算方法。
背景技術
目前應用最廣的事件文本相關度計算方法是基于向量空間模型的余弦計算方法。向量空間模型將事件類文本表示成一個權值向量,向量中的每一項均由詞項組成,而每個詞項的權重由TFIDF方法確定。余弦計算公式則計算文本權值向量的夾角的余弦值,并以此作為事件相關度。
但是使用基于向量空間模型的余弦計算方法計算事件的相似度時,存在以下不足:向量空間模型把文本看成詞項的集合,把詞項與詞項之間的關系看成是獨立的,這樣就損失了大量的文本結構信息。余弦計算公式沒有考慮文本中關鍵詞之間的語義相關性。
發明內容
本發明的目的在于針對基于向量空間模型的余弦計算方法的不足,提供一種基于關聯語義鏈網絡的事件相關度計算方法,該計算方法以事件的關聯語義鏈網絡為相關度的參照物,關聯語義鏈網絡包括事件的關鍵詞及關鍵詞之間的關聯關系,關系具有權重。從共有關鍵詞和關聯關系兩個方面量化對參照物進行量化,以關聯語義鏈網絡的相關程度為相關度的衡量標準。
為了達到上述的目的,本發明采用下述技術方案:
一種基于關聯語義鏈網絡的事件相關度計算方法,其具體步驟如下:
(1)輸入領域中的任意兩個事件類文本集;
(2)將每個事件類文本集表示為關聯語義鏈網絡;
(3)計算事件在關鍵詞上的相關度;
(4)計算事件在關聯關系上的相關度;
(5)輸出事件的相關度。
所述步驟(2)的事件的關聯語義鏈網絡,其表示如下:
EALN=K,W
其中,K={k1,k2,...,kn}為事件關鍵詞的集合,n為網絡中關鍵詞個數,W是n×n的對稱關聯矩陣,該矩陣中第i行、第j列的元素wij為關鍵詞ki(1≤i≤n)和關鍵詞kj(1≤j≤n)的關聯權重大小。
所述步驟(3)中的關鍵詞上的相關度,其相關度計算式如下:
其中,n為事件Eu和事件Ev在背景關鍵詞網絡中共有的關鍵詞個數,p(wi,Eu)表示關鍵詞wi在事件Eu的關聯語義鏈網絡中的權重,p(wi,Ev)表示關鍵詞wi在事件Ev的關聯語義鏈網絡中的權重,為關鍵詞wi在事件Eu的關聯語義鏈中的度的大小。
所述步驟(4)中的關聯關系上的相關度,其相關度計算式如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學;阿里巴巴集團控股有限公司,未經上海大學;阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910985738.0/2.html,轉載請聲明來源鉆瓜專利網。





