[發明專利]一種基于自然語言處理的電網啟動操作票生成裝置及方法有效
| 申請號: | 201811028203.6 | 申請日: | 2018-09-04 |
| 公開(公告)號: | CN109376353B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 葉海;滕曉畢;宋柄兵;陳磊;阮少輝;何星;傅山 | 申請(專利權)人: | 國家電網公司華東分部;上海交通大學 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/30;G06Q10/10;G06Q50/06 |
| 代理公司: | 上海思微知識產權代理事務所(普通合伙) 31237 | 代理人: | 劉翔 |
| 地址: | 200120 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 自然語言 處理 電網 啟動 操作 生成 裝置 方法 | ||
1.一種基于自然語言處理的電網啟動操作票生成裝置,包括:
中文分詞與詞性標注模塊,用于結合電網詞典,通過分詞和詞性標注,提取輸入啟動方案中指令語句的語句結構;
命名實體識別和關系抽取模塊,用于通過命名實體識別提取出指令語句的操作設備和設備狀態,并結合詞性標注的結果進一步解析指令語句,對操作設備實體與設備狀態建立屬性關系,并建立不同指令語句的實體關系;
啟動方案生成模塊,用于結合電網領域相關先驗知識與規則,獲得啟動操作票指令語句的關鍵信息,生成標準的啟動操作票。
2.如權利要求1所述的一種基于自然語言處理的電網啟動操作票生成裝置,其特征在于:所述裝置還包括數據預處理模塊,所述數據預處理模塊用于在分詞和詞性標注前對輸入啟動方案進行數據清洗與預處理。
3.如權利要求1所述的一種基于自然語言處理的電網啟動操作票生成裝置,其特征在于:所述中文分詞與詞性標注模塊引入電網先驗知識和相關數據庫作為電網詞典,加大電網設備和狀態的詞頻,增大分詞的顆粒度。
4.如權利要求1所述的一種基于自然語言處理的電網啟動操作票生成裝置,其特征在于:所述中文分詞與詞性標注模塊采用基于統計的方法的分詞算法對啟動方案進行分詞,使用Trie樹結構進行高效的詞圖掃描,生成待分詞的句子中漢字所有可能成詞情況所構成的有向無環圖。
5.如權利要求4所述的一種基于自然語言處理的電網啟動操作票生成裝置,其特征在于:所述中文分詞與詞性標注模塊采用的分詞算法還采用動態規劃算法查找最大概率路徑,找出基于詞頻的最大切分組合。
6.如權利要求1所述的一種基于自然語言處理的電網啟動操作票生成裝置,其特征在于:所述中文分詞與詞性標注模塊采用的詞性標注算法為基于統計模型的標注方法,對于未登錄詞采用隱馬爾科夫模型進行詞性標注。
7.如權利要求1所述的一種基于自然語言處理的電網啟動操作票生成裝置,其特征在于:所述命名實體識別和關系抽取模塊采用基于混合方法實現命名實體識別,其通過結合電網領域詞典和統計模型識別電網對象。
8.如權利要求7所述的一種基于自然語言處理的電網啟動操作票生成裝置,其特征在于:所述命名實體識別和關系抽取模塊的關系抽取為確定實體與實體間的語義聯系,其通過命名實體識別得到單句指令語句中設備實體和設備狀態,即可確定單句指令語句的實體關系和指令結構,對設備實體與設備狀態建立屬性關系。
9.如權利要求1所述的一種基于自然語言處理的電網啟動操作票生成裝置,其特征在于:所述命名實體識別和關系抽取模塊還通過與專業數據庫進行交互,將設備實體名稱更換為標準設備名稱,對整個啟動方案統一建立設備實體庫,整合不同指令語句中相同設備實體,建立不同指令語句的實體關系。
10.一種基于自然語言處理的電網啟動操作票生成方法,包括如下步驟:
步驟S1,結合電網詞典,通過分詞和詞性標注,提取輸入啟動方案中指令語句的語句結構;
步驟S2,通過命名實體識別提取出指令語句的操作設備和設備狀態,結合詞性標注的結果進一步解析指令語句,對設備實體與設備狀態建立屬性關系,并建立不同指令語句的實體關系;
步驟S3,結合電網領域相關先驗知識與規則,獲得啟動操作票指令語句的關鍵信息,生成標準的啟動操作票。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網公司華東分部;上海交通大學,未經國家電網公司華東分部;上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811028203.6/1.html,轉載請聲明來源鉆瓜專利網。





