[發(fā)明專利]一種從海量文本中抽取里程碑事件的方法有效
| 申請?zhí)枺?/td> | 201910539127.3 | 申請日: | 2019-06-20 |
| 公開(公告)號: | CN110245209B | 公開(公告)日: | 2022-09-23 |
| 發(fā)明(設計)人: | 王鵬宇;吳漾;羅念華;孔慶波;繆新萍;李文科 | 申請(專利權)人: | 貴州電網(wǎng)有限責任公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/35 |
| 代理公司: | 貴陽中新專利商標事務所 52100 | 代理人: | 胡緒東 |
| 地址: | 550002 貴*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 海量 文本 抽取 里程碑 事件 方法 | ||
1.一種從海量文本中抽取里程碑事件的方法,其特征在于:該方法包括以下步驟:
(1)在海量文本中抽取文件的文件夾層級關聯(lián)信息,以文件名、文件夾名為節(jié)點,以層級關系為邊,通過樹形結(jié)構進行數(shù)據(jù)存儲;
(2)將文件名和文件的路徑名進行拼接作為當前文件的文本,使用K-Means聚類算法,計算每個文件的樹形距離,將具有相同層級關系的文件劃分在一起作為初始聚類簇,同時確定K-Means聚類算法的初始類簇大??;
(3)針對步驟(2)中獲得的聚類結(jié)果,在每一個聚類簇下進行里程碑事件和時間節(jié)點的抽取,對抽取結(jié)果做篩選后形成事件的里程碑節(jié)點列表。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貴州電網(wǎng)有限責任公司,未經(jīng)貴州電網(wǎng)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910539127.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫海量數(shù)據(jù)比對的方法
- 基于云計算的海量數(shù)據(jù)訪問處理系統(tǒng)
- 一種實現(xiàn)海量數(shù)據(jù)離線分析的方法
- 一種海量矢量切片數(shù)據(jù)云存儲方法及系統(tǒng)
- 一種多源海量數(shù)據(jù)處理系統(tǒng)及方法
- 快速實現(xiàn)海量數(shù)據(jù)準實時全量統(tǒng)計的方法、裝置及系統(tǒng)
- 一種海量數(shù)據(jù)分析系統(tǒng)及方法
- 在線繪制地圖海量線的方法
- 一種海量點數(shù)據(jù)聚合渲染方法、裝置、設備及存儲介質(zhì)
- 一種海量不確定XML數(shù)據(jù)存儲方法





