[發明專利]一種基于非負矩陣分解的事件分析方法與系統在審
| 申請號: | 201410495959.7 | 申請日: | 2014-09-24 |
| 公開(公告)號: | CN104281663A | 公開(公告)日: | 2015-01-14 |
| 發明(設計)人: | 張日崇;邰振贏;于偉仁;劉俊偉;李建欣 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 劉芳 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 矩陣 分解 事件 分析 方法 系統 | ||
1.一種基于非負矩陣分解的事件分析方法,其特征在于,包括:
獲取待處理數據,所述待處理數據中包括至少一個數據文本;
分別對所述至少一個數據文本中的每個數據文本進行分詞處理,得到與所述待處理數據對應的文本空間矩陣,所述文本空間矩陣描述了所述至少一個數據文本中所包含的詞語信息;
對所述文本空間矩陣進行非負矩陣分解,根據分解得到的基矩陣確定所述待處理數據中包含的各個事件以及分別用于描述所述各個事件的關鍵詞,并根據分解得到的系數矩陣確定分別與所述各個事件對應的數據文本。
2.根據權利要求1所述的方法,其特征在于,所述待處理數據中包括N個數據文本,所述N個數據文本中包含的詞語總數為M,所述文本空間矩陣AM×N為M×N維矩陣,所述N的取值為大于或等于1的整數;
所述對所述文本空間矩陣進行非負矩陣分解,根據分解得到的基矩陣確定所述待處理數據中包含的各個事件以及分別用于描述所述各個事件的關鍵詞,并根據分解得到的系數矩陣確定分別與所述各個事件對應的數據文本,包括:
對所述文本空間矩陣AM×N進行非負矩陣分解,得到基矩陣WM×K,和系數矩陣HK×N,所述K為所述待處理數據中包含的事件總數;
確定所述基矩陣WM×K中的每個列向量表征一個第一事件,每個列向量中包含的詞語為描述對應的第一事件的關鍵詞;
確定所述系數矩陣HK×N中的每個行向量表征一個第二事件,每個行向量中所包含的數據文本為與所述行向量表征的第二事件對應的數據文本。
3.根據權利要求2所述的方法,其特征在于,所述分別對所述至少一個數據文本中的每個數據文本進行分詞處理,包括:
對所述每個數據文本進行語義解析,確定所述每個數據文本中包含的名詞和動詞;
對確定出的所述名詞和動詞進行標注,并根據如下公式確定每個所述名詞和動詞的權重值:
R(w)=(w在所述M個詞語中的出現次數)×log(數據文本總數N/包含w的數據文本數量);
其中,w為任一個所述名詞或動詞,R(w)為w的權重值。
4.根據權利要求3所述的方法,其特征在于,所述確定所述基矩陣WM×K中的每個列向量表征一個第一事件,每個列向量中包含的詞語為描述對應的第一事件的關鍵詞,包括:
確定所述基矩陣WM×K中的每個列向量表征一個第一事件,每個列向量中包含的目標詞語為描述對應的第一事件的關鍵詞,所述目標詞語為所述列向量包含的詞語中權重值由大到小排列排在前面的第一預設數量的名詞和動詞。
5.根據權利要求1至4中任一項所述的方法,其特征在于,所述對所述文本空間矩陣進行非負矩陣分解,根據分解得到的基矩陣確定所述待處理數據中包含的各個事件以及分別用于描述所述各個事件的關鍵詞,并根據分解得到的系數矩陣確定分別與所述各個事件對應的數據文本之后,還包括:
分別以所述各個事件中的每個事件作為待處理事件,從所述待處理事件對應的關鍵詞中選取第二預設數量的關鍵詞作為所述待處理事件的標識;
確定所述待處理事件對應的數據文本的數量占所述待處理數據的數據文本總數的比例;
根據所述標識和所述比例,采用如下呈現方式中的任一種方式呈現所述待處理事件:
表格、餅狀圖、柱狀圖、折線圖、詞云。
6.一種基于非負矩陣分解的事件分析系統,其特征在于,包括:
獲取模塊,用于獲取待處理數據,所述待處理數據中包括至少一個數據文本;
處理模塊,用于分別對所述至少一個數據文本中的每個數據文本進行分詞處理,得到與所述待處理數據對應的文本空間矩陣,所述文本空間矩陣描述了所述至少一個數據文本中所包含的詞語信息;
計算模塊,用于對所述文本空間矩陣進行非負矩陣分解,根據分解得到的基矩陣確定所述待處理數據中包含的各個事件以及分別用于描述所述各個事件的關鍵詞,并根據分解得到的系數矩陣確定分別與所述各個事件對應的數據文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410495959.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電力企業私有云環境資源分配評估模型
- 下一篇:一種學生宿舍專用的服務系統





