[發(fā)明專利]一種電力調(diào)度文本的處理方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202010093154.5 | 申請日: | 2020-02-14 |
| 公開(公告)號: | CN111382227A | 公開(公告)日: | 2020-07-07 |
| 發(fā)明(設(shè)計(jì))人: | 季曉慧;李晨;劉金波;狄方春 | 申請(專利權(quán))人: | 中國地質(zhì)大學(xué)(北京) |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F40/242;G06F40/289;G06Q10/06;G06Q50/06 |
| 代理公司: | 北京知呱呱知識產(chǎn)權(quán)代理有限公司 11577 | 代理人: | 盛明星 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 電力 調(diào)度 文本 處理 方法 系統(tǒng) | ||
本發(fā)明實(shí)施例涉及一種電力調(diào)度文本的處理方法及系統(tǒng),其中,所述方法包括:采集調(diào)度文本,并對所述調(diào)度文本進(jìn)行分詞處理,以得到所述調(diào)度文本對應(yīng)的詞匯集合;識別所述詞匯集合中的頻繁一項(xiàng)集,并基于所述頻繁一項(xiàng)集構(gòu)建頻繁模式樹;從所述頻繁模式樹中獲取條件模式基,并基于所述條件模式基遞歸得到所述詞匯集合中的頻繁項(xiàng)集。本申請?zhí)峁┑募夹g(shù)方案,能夠挖掘出調(diào)控人員在日常調(diào)度工作時的操作行為特征及調(diào)度習(xí)慣。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種電力調(diào)度文本的處理方法及系統(tǒng)。
背景技術(shù)
隨著智能電網(wǎng)建設(shè)的開展,電力大數(shù)據(jù)呈現(xiàn)爆發(fā)式增長。這些電力數(shù)據(jù)中隱藏著關(guān)系到電網(wǎng)安全穩(wěn)定運(yùn)行的信息,成為電力領(lǐng)域?qū)氋F的資產(chǎn)。然而由于計(jì)算能力和技術(shù)方法問題,電力領(lǐng)域的大數(shù)據(jù)每年只有很少的部分被挖掘。因此如何合理有效地挖掘電力大數(shù)據(jù)是目前電力領(lǐng)域面臨的緊迫的問題。
電力數(shù)據(jù)類型眾多,包括電力負(fù)荷數(shù)據(jù)和文本數(shù)據(jù)等。其中文本數(shù)據(jù),因記載著調(diào)控人員操作行為特征及調(diào)度習(xí)慣而具有較高的挖掘價值和挖掘前景,因此電力文本挖掘是電力設(shè)備健康管理重點(diǎn)關(guān)注的關(guān)鍵技術(shù)之一。
當(dāng)前自然語言處理、人工智能等技術(shù)快速發(fā)展,為電力文本挖掘提供了良好的技術(shù)基礎(chǔ);同時電網(wǎng)企業(yè)已積累了大量與電力設(shè)備健康相關(guān)的文本,如缺陷、消缺等短文本,以及試驗(yàn)、故障分析報告等長文本,具備了文本挖掘的數(shù)據(jù)條件。此外,電網(wǎng)企業(yè)已建立了諸多與設(shè)備健康相關(guān)的標(biāo)準(zhǔn),如分別針對輸變電設(shè)備和配電網(wǎng)設(shè)備的缺陷分類標(biāo)準(zhǔn)、設(shè)備狀態(tài)評價導(dǎo)則、狀態(tài)檢修試驗(yàn)規(guī)程等,為文本挖掘的應(yīng)用提供了參照與規(guī)則支持。因而,電力文本挖掘的條件已具備,且發(fā)展前景廣闊。然而,由于現(xiàn)階段知識和技術(shù)層面上的匱乏。
文本挖掘技術(shù)的大部分研究還處于探究試驗(yàn)階段,應(yīng)用效益尚未顯現(xiàn)。與互聯(lián)網(wǎng)、醫(yī)學(xué)等行業(yè)取得的成就相比,電力行業(yè)的文本挖掘研究還有待加強(qiáng),電力調(diào)度領(lǐng)域很多方向的文本挖掘還沒有研究。目前還沒有一種專門針對調(diào)控人員的日常在調(diào)度工作時的操作行為特征及調(diào)度習(xí)慣的挖掘方法。
綜上所述,考慮到目前電力領(lǐng)域文本方法存在的問題,需要一種調(diào)度文本挖掘方法以解決上述問題。
發(fā)明內(nèi)容
本申請的目的在于提供一種電力調(diào)度文本的處理方法及系統(tǒng),能夠挖掘出調(diào)控人員在日常調(diào)度工作時的操作行為特征及調(diào)度習(xí)慣。
為實(shí)現(xiàn)上述目的,本申請?zhí)峁┮环N電力調(diào)度文本的處理方法,所述方法包括:采集調(diào)度文本,并對所述調(diào)度文本進(jìn)行分詞處理,以得到所述調(diào)度文本對應(yīng)的詞匯集合;識別所述詞匯集合中的頻繁一項(xiàng)集,并基于所述頻繁一項(xiàng)集構(gòu)建頻繁模式樹;從所述頻繁模式樹中獲取條件模式基,并基于所述條件模式基遞歸得到所述詞匯集合中的頻繁項(xiàng)集。
進(jìn)一步地,所述方法還包括:
檢測分詞處理結(jié)果中的停用詞,并將檢測得到的所述停用詞從分詞處理結(jié)果中剔除。
進(jìn)一步地,基于所述頻繁一項(xiàng)集構(gòu)建頻繁模式樹包括:
掃描所述詞匯集合,并統(tǒng)計(jì)各個頻繁一項(xiàng)集支持度;
按照統(tǒng)計(jì)的支持度從各個所述頻繁一項(xiàng)集中篩選出目標(biāo)頻繁一項(xiàng)集,并將所述目標(biāo)頻繁一項(xiàng)集放入項(xiàng)頭表中,其中,所述項(xiàng)頭表中的目標(biāo)頻繁一項(xiàng)集按照支持度降序排列;
在所述詞匯集合中,將非頻繁一項(xiàng)集的數(shù)據(jù)刪除,并將剩余的數(shù)據(jù)按照頻繁一項(xiàng)集的支持度降序排列;
讀取排序后的數(shù)據(jù),并將排序后的數(shù)據(jù)插入頻繁模式樹;其中,在所述頻繁模式樹中排序靠前的節(jié)點(diǎn)為祖先節(jié)點(diǎn),排序靠后的節(jié)點(diǎn)為子孫節(jié)點(diǎn)。
進(jìn)一步地,所述方法還包括:
若多個子孫節(jié)點(diǎn)共用同一個祖先節(jié)點(diǎn),按照子孫節(jié)點(diǎn)的數(shù)量,增加共用的祖先節(jié)點(diǎn)的計(jì)數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國地質(zhì)大學(xué)(北京),未經(jīng)中國地質(zhì)大學(xué)(北京)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010093154.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 電力控制器、電力生成系統(tǒng)以及電力控制器的控制方法
- 電力供給裝置、電力接收裝置和包括電力接收裝置的車輛以及用于電力供給系統(tǒng)的控制方法
- 電力接收裝置、電力傳送裝置及其控制方法
- 一種智能電力客服系統(tǒng)的構(gòu)建方法及系統(tǒng)
- 無線電力傳輸系統(tǒng)、無線電力發(fā)送裝置和無線電力接收裝置
- 一種電力監(jiān)控平臺數(shù)據(jù)信息映射匹配方法及系統(tǒng)
- 用于電力分配的系統(tǒng)和方法
- 電力傳輸裝置、電力接收裝置和電力傳輸裝置的控制方法
- 一種電力傳輸線圈無線傳輸電力的無線電力傳輸系統(tǒng)
- 一種電力運(yùn)行數(shù)據(jù)監(jiān)控系統(tǒng)
- 旅游車輛調(diào)度監(jiān)控方法及其系統(tǒng)
- 一種用戶隊(duì)列調(diào)度的方法和裝置
- 一種資源調(diào)度的方法、裝置和過濾式調(diào)度器
- 一種調(diào)度方法和裝置
- 一種調(diào)度終端動態(tài)切換調(diào)度組歸屬關(guān)系的方法及裝置
- 用戶調(diào)度方法、裝置、基站和存儲介質(zhì)
- 一種食材的調(diào)度系統(tǒng)和方法
- 一種資源調(diào)度的方法、裝置和過濾式調(diào)度器
- 任務(wù)調(diào)度方法、裝置、設(shè)備及存儲介質(zhì)
- 一種自動化調(diào)度系統(tǒng)和調(diào)度方法
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





