[發(fā)明專利]一種核電大數據經驗檢索與推送方法在審
| 申請?zhí)枺?/td> | 202110270844.8 | 申請日: | 2021-03-12 |
| 公開(公告)號: | CN113064924A | 公開(公告)日: | 2021-07-02 |
| 發(fā)明(設計)人: | 張琪;李兵華;張廉;穆強;伍吉澤;馬寅軍;劉旭嘉;朱智強;沈炫辰;吳勤浩;陳雨;龔瑞;高小杰 | 申請(專利權)人: | 中核核電運行管理有限公司 |
| 主分類號: | G06F16/2457 | 分類號: | G06F16/2457;G06F16/242;G06F16/25;G06F16/215;G06F40/30 |
| 代理公司: | 核工業(yè)專利中心 11007 | 代理人: | 陳早璟 |
| 地址: | 314300 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 核電 數據 經驗 檢索 推送 方法 | ||
1.一種核電大數據經驗檢索與推送方法,其特征在于:包括步驟一:經驗反饋大數據平臺應用架構建設;步驟二:經驗反饋大數據平臺采集架構建設;步驟三:經驗反饋大數據平臺檢索;步驟四:經驗反饋大數據平臺推送。
2.根據權利要求1所述的一種核電大數據經驗檢索與推送方法,其特征在于:步驟一:經驗反饋大數據平臺應用架構建設,具體包括:在已有大數據平臺基礎上,架設ETL數據抽取、詞庫管理、數據管理、用戶管理四個基礎功能,構建自然語言分詞服務,全文檢索服務兩個核心功能,精準檢索、智能推送、專業(yè)詞庫管理三個應用。
3.根據權利要求1所述的一種核電大數據經驗檢索與推送方法,其特征在于:步驟一:經驗反饋大數據平臺應用架構建設,具體構建為四層,具體包括:
數據采集層:從相關的生成系統(tǒng)中采集結構化和非結構化數據,作為ETL的數據源;
數據計算層:根據數據模板對采集到的數據進行數據清洗、內容分析、關鍵詞提取、數據歸約處理,完成數據的分析歸類及詞庫的關聯權重處理;
數據服務層:對計算后的數據進行索引處理和存儲,為數據應用層提供搜索和智能語意分析處理,實現智能搜索和推送服務;
數據應用層:提供相應的數據調用接口和數據應用界面服務。
4.根據權利要求1所述的一種核電大數據經驗檢索與推送方法,其特征在于:步驟二:經驗反饋大數據平臺采集架構建設,具體包括:將生產管理工單系統(tǒng)、經驗反饋系統(tǒng)數據庫中的數據內容,抽取到大數據平臺中;結構化數據源,將核電生產系統(tǒng)中的歷史數據表進行全量抽取,對實時數據進行增量抽取;對核電生產系統(tǒng)中非結構化日志進行采集;經過數據流處理和邏輯分析后,將結果數據存入數據表。
5.根據權利要求1所述的一種核電大數據經驗檢索與推送方法,其特征在于:步驟三:經驗反饋大數據平臺智能檢索,具體包括:
(1)建立核電經驗反饋大數據詞庫,主要包括兩部分,核電專業(yè)詞庫、同義詞庫和停用詞庫;核電專業(yè)詞庫由業(yè)務人員創(chuàng)建,同義詞庫需按照業(yè)務需求來提供,主要是建立詞與詞的對應關系;
(2)優(yōu)化分詞模型,將現有的、流行的分詞工具對核電語料進行分詞,專業(yè)人員對分詞結果糾錯后,再用分詞工具對糾錯后的語料進行學習,從而優(yōu)化分詞模型;
(3)自然語言處理,自然語言處理是將歷史經驗反饋語料、檢索輸入等進行中文分詞、去停用詞、詞性標注、依存句法分析、特征提取、句子相似度比較、文本相似度比較;
(4)中文分詞,采用優(yōu)化后的分詞模型,結合核電經驗反饋專業(yè)詞庫,對數據庫中的經驗反饋數據信息、用戶輸入檢索條件的數據信息通過語義分詞技術進行中文分詞。
6.根據權利要求1所述的一種核電大數據經驗檢索與推送方法,其特征在于:步驟四:經驗反饋大數據平臺推送,具體包括:
(1)主要分為歷史工單的精準推送與歷史事件的精準推送;
(2)精準推送,采用基于語義分析和搜索引擎的技術來匹配歷史經驗反饋信息與工單任務概述相關字段的相似度,根據相似度返回排序結果,工單與歷史經驗反饋信息的業(yè)務規(guī)則匹配進行權重匹配,形成最終排序結果并推送給工單準備人;
(3)工單任務準備人可選擇與當前工單最相關的經驗反饋信息,納入工作包;維修工作準備人在準備當前工單時,工單相關工作信息已填入工單系統(tǒng),根據已填入工單信息,利用語義分析和智能檢索手段,將對工單任務與歷史經驗反饋信息進行規(guī)則匹配。將匹配的精準推送的內容,直接推送至工作準備人。
7.根據權利要求3所述的一種核電大數據經驗檢索與推送方法,其特征在于:所述的數據清洗,包括:專業(yè)人員對數據結構、數據表單和字段進行預處理,預處理是對具體數據的字段進行選取,不需要的字段將其剔除,降低數據語義分詞的難度。
8.根據權利要求7所述的一種核電大數據經驗檢索與推送方法,其特征在于:所述的預處理包括數據清理與數據集成;數據清理,是進行數據格式標準化、異常數據清除、錯誤糾正、重復數據的清除;數據集成,是將不同數據源中的數據進行整合并統(tǒng)一存儲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中核核電運行管理有限公司,未經中核核電運行管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110270844.8/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統(tǒng)、數據中繼設備、數據中繼方法、數據系統(tǒng)、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發(fā)送方法、數據發(fā)送系統(tǒng)、數據發(fā)送裝置以及數據結構
- 數據顯示系統(tǒng)、數據中繼設備、數據中繼方法及數據系統(tǒng)
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發(fā)送和數據接收設備、數據發(fā)送和數據接收方法
- 數據發(fā)送裝置、數據接收裝置、數據收發(fā)系統(tǒng)、數據發(fā)送方法、數據接收方法和數據收發(fā)方法
- 數據發(fā)送方法、數據再現方法、數據發(fā)送裝置及數據再現裝置
- 數據發(fā)送方法、數據再現方法、數據發(fā)送裝置及數據再現裝置





