[發明專利]一種災難故事線構建方法及裝置有效
| 申請號: | 201811382046.9 | 申請日: | 2018-11-20 |
| 公開(公告)號: | CN109582958B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 周綺鳳;倪進鑫;安超杰 | 申請(專利權)人: | 廈門大學深圳研究院 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/295;G06F16/35;G06F16/36;G06Q50/26;G06N3/0442;G06N3/045;G06N3/047;G06N3/0895 |
| 代理公司: | 北京細軟智谷知識產權代理有限責任公司 11471 | 代理人: | 葛鐘 |
| 地址: | 518000 廣東省深圳市南山*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 災難 故事 構建 方法 裝置 | ||
1.一種災難故事線構建方法,其特征在于,所述方法包括:
收集指定災難的相關信息,包括:利用網絡爬蟲技術在互聯網上獲取指定災難的相關信息;從所爬取的信息中選取預設目標信息作為所述相關信息;
具體包括:通過基于度和集聚系數的節點重要性方法從所爬取的信息中選取重要信息從而達到去除冗余信息的目標,得到所述相關信息;
其中,度指標描述一個節點的鄰居節點的個數,
ki=∑j∈Gδij
其中,
i,j為不同節點;
集聚系數描述了網絡中節點的鄰居之間互為鄰居的比例,表示為:
節點重要性評價指標pi表示為:
其中,fi為節點i自身度與其鄰居度之和,表示為:
其中,kw表示節點w的度,Δi表示節點i的鄰居節點集合;函數gi表示為:
根據節點重要性評價指標pi,在所述爬取的信息中選取重要信息從而達到去除冗余信息的目標,得到所述相關信息;
從所述相關信息中提取所述指定災難相關的三元組實體信息;
抽取所述三元組實體信息間的關系;
抽取所述指定災難的實體的屬性;
根據所述三元組實體信息、所述三元組實體信息間的關系與所述指定災難的實體的屬性,構建所述指定災難的故事線,包括:構建局部災難故事線;生成全局災難故事線;其中,所述生成全局災難故事線,包括:
構造代價函數,所述代價函數用于描述至少2個圖譜之間的相似程度;
根據代價函數判斷所述至少2個局部圖譜之間是否有有向邊連接;
融合所述代價函數與所述局部圖譜,構造全局故事線;
所述至少2個局部圖譜的個數為2時,所述代價函數包括:
其中,d(i,j)表示表示歸一化后的i和j兩個圖譜描述的地點之間的距離;Nj表示圖譜j的三元組的數量。
2.根據權利要求1所述的方法,其特征在于,所述從所爬取的信息中選取預設目標信息,包括:利用基于度和集聚系數的網絡節點度量重要性方法,從所爬取的信息中選取預設目標信息。
3.根據權利要求1所述的方法,其特征在于,所述從所述相關信息中提取所述指定災難相關的三元組實體信息,包括:利用融合條件隨機場的雙向循環神經網絡模型在預處理后的信息中提取災難相關的三元組實體信息。
4.根據權利要求1所述的方法,其特征在于,所述抽取所述三元組實體信息間的關系,包括:利用注意力機制的雙向循環神經網絡模型抽取災難實體間的關系。
5.根據權利要求1所述的方法,其特征在于,所述抽取所述指定災難的實體的屬性,包括:利用Bootstrapping模型抽取指定災難的實體的屬性。
6.根據權利要求1所述的方法,其特征在于,所述構建局部災難故事線包括:
通過地點實體進行分類,得到不同地點的信息災難實體關系、災難實體屬性;
進行災難實體消歧;
進行災難屬性融合。
7.一種災難故事線構建裝置,其特征在于,包括:信息收集模塊、實體信息提取模塊、實體關系抽取模塊、實體屬性抽取模塊、故事線生成模塊;
所述信息收集模塊用于收集指定災難的相關信息,具體用于利用網絡爬蟲技術在互聯網上獲取指定災難的相關信息;從所爬取的信息中選取預設目標信息作為所述相關信息;具體用于:通過基于度和集聚系數的節點重要性方法從所爬取的信息中選取重要信息從而達到去除冗余信息的目標,得到所述相關信息;
其中,度指標描述一個節點的鄰居節點的個數,
ki=∑j∈Gδij
其中,
i,j為不同節點;
集聚系數描述了網絡中節點的鄰居之間互為鄰居的比例,表示為:
節點重要性評價指標pi表示為:
其中,fi為節點i自身度與其鄰居度之和,表示為:
其中,kw表示節點w的度,Δi表示節點i的鄰居節點集合;函數gi表示為:
根據節點重要性評價指標pi,在所述爬取的信息中選取重要信息從而達到去除冗余信息的目標,得到所述相關信息;
所述實體信息提取模塊用于從所述相關信息中提取所述指定災難相關的三元組實體信息;
所述實體關系抽取模塊用于抽取所述三元組實體信息間的關系;
所述實體屬性抽取模塊用于抽取所述指定災難的實體的屬性;
所述故事線生成模塊用于根據所述三元組實體信息、所述三元組實體信息間的關系與所述指定災難的實體的屬性,構建所述指定災難的故事線;具體用于構建局部災難故事線;生成全局災難故事線;其中,所述生成全局災難故事線,包括:
構造代價函數,所述代價函數用于描述至少2個圖譜之間的相似程度;
根據代價函數判斷所述至少2個局部圖譜之間是否有有向邊連接;
融合所述代價函數與所述局部圖譜,構造全局故事線;
所述至少2個局部圖譜的個數為2時,所述代價函數包括:
其中,d(i,j)表示表示歸一化后的i和j兩個圖譜描述的地點之間的距離;
Nj表示圖譜j的三元組的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學深圳研究院,未經廈門大學深圳研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811382046.9/1.html,轉載請聲明來源鉆瓜專利網。





