[發(fā)明專利]一種核電材料服役性能信息提取方法在審
| 申請?zhí)枺?/td> | 201910604461.2 | 申請日: | 2019-07-05 |
| 公開(公告)號: | CN110458397A | 公開(公告)日: | 2019-11-15 |
| 發(fā)明(設計)人: | 劉嘯天;張彥召;孫大健;張晏瑋;薛飛;遆文新 | 申請(專利權)人: | 蘇州熱工研究院有限公司;中國廣核集團有限公司;中國廣核電力股份有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/06;G06N20/00 |
| 代理公司: | 32103 蘇州創(chuàng)元專利商標事務所有限公司 | 代理人: | 孫仿衛(wèi)<國際申請>=<國際公布>=<進入 |
| 地址: | 215004江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 核電廠 材料服役性能 信息提取 信息提取系統(tǒng) 服役性能 核電材料 機器學習 信息樣本 樣本庫 清洗 分類標記 基于機器 排布規(guī)則 清洗系統(tǒng) 系統(tǒng)實現(xiàn) 規(guī)則表 排序 學習 | ||
本發(fā)明涉及一種核電材料服役性能信息提取方法,包括以下步驟:步驟1:利用基于機器學習的信息清洗系統(tǒng)和術語集與表達規(guī)則表,對由核電廠獲取的各類與材料服役性能相關的信息進行處理,得到清洗后的信息;步驟2:采用人工方法對部分由核電廠獲取的各類與材料服役性能相關的信息進行分類標記和信息提取,獲得若干信息樣本,再按照對應的排布規(guī)則對信息樣本進行排序,獲得樣本庫;步驟3:利用樣本庫進行機器學習而得到信息提取系統(tǒng),利用信息提取系統(tǒng)處理清洗后的信息,得到所要提取的信息。本發(fā)明利用機器學習后的系統(tǒng)實現(xiàn)對核電材料服役性能信息的提取,可以提高信息提取的效率和準確性,適用于核電廠中對各類與材料服役性能相關的信息的處理。
技術領域
本發(fā)明屬于核電廠信息處理領域,具體涉及一種核電材料服役性能信息提取方法。
背景技術
核電廠的材料服役性能是關于核電廠運行的安全性、可靠性和經濟性的研究內容,是核電領域重要的研究方向。進行相關研究所需的相關的數(shù)據(jù),種類繁多,數(shù)量巨大。同時由于國內核電廠的建設、運行經歷了從無到有的摸索過程,設備、材料的國產化程度也從低到高,所以整個過程中各種數(shù)據(jù)的記錄方式并不統(tǒng)一,同時數(shù)據(jù)的產生、傳遞過程的巨大差別也造成了數(shù)據(jù)種類多,整體結構化程度低。
針對現(xiàn)狀,需要一種可以適用于大量、低結構化程度數(shù)據(jù)的核電廠服役性能信息提取方法。核電材料服役性能相關的數(shù)據(jù)描述的專業(yè)性、對于同類問題描述的差異性較大,還可能存在不同的縮寫、簡寫、不規(guī)范表達等情況,現(xiàn)有的通用文本挖掘和處理技術無法直接應用,且面對核電廠與材料服役性能相關數(shù)據(jù)中普遍的短文本等問題也存在根本上的技術障礙。故需要一套適用于核電材料服役性能信息特征的數(shù)據(jù)清洗、模型訓練方法和信息提取方法。
發(fā)明內容
本發(fā)明的目的是提供一種適用于核電廠信息處理,能夠提高準確性和效率的核電材料服役性能信息提取方法。
為達到上述目的,本發(fā)明采用的技術方案是:
一種核電材料服役性能信息提取方法,包括以下步驟:
步驟1:數(shù)據(jù)清洗:利用基于機器學習的信息清洗系統(tǒng)和為提取材料服役性能相關信息所專門建立的術語集與表達規(guī)則表,對由核電廠獲取的各類與材料服役性能相關的信息進行處理,從而得到清洗后的信息;
步驟2:建模:采用人工方法對部分由核電廠獲取的各類與材料服役性能相關的信息進行分類標記和信息提取,從而獲得滿足數(shù)量要求的若干項信息樣本,再按照對應的排布規(guī)則對各項所述信息樣本進行排序,從而獲得樣本庫;
步驟3:信息提取:利用所述樣本庫進行機器學習而得到用于提取信息的信息提取系統(tǒng),利用所述信息提取系統(tǒng)處理清洗后的信息,從而得到所要提取的信息
所述步驟1中,所述信息清洗系統(tǒng)進行機器學習的方法為:建立核電材料服役性能專用術語集以及慣用表達規(guī)則表,利用所述核電材料服役性能專用術語集和所述慣用表達規(guī)則表進行機器學習而得到所述信息清洗系統(tǒng)。
所述步驟2包括以下子步驟:
子步驟a:目標信息篩選:按照與材料服役性能的相關性強弱,從部分由核電廠獲取的各類與材料服役性能相關的信息中篩選出若干類待處理的信息;
子步驟b:確定分類方法:針對各類所述待處理的信息,確定其對應的分類原則和/或閾值;
子步驟c:人工標記:對各類所述待處理的信息,依據(jù)其對應的分類原則和/或閾值結合指定的標記原則進行人工分類標記和信息提取,從而獲得所述信息樣本;
子步驟d:樣本排布:依據(jù)選定的排布規(guī)則將各項所述信息樣本進行排序,從而獲得所述樣本庫。
所述子步驟a中,篩選出的所述待處理的信息包括核電廠設備材料/機理分析數(shù)據(jù)、核電廠運行經驗反饋信息、設備專項評估結論和審查結論。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州熱工研究院有限公司;中國廣核集團有限公司;中國廣核電力股份有限公司,未經蘇州熱工研究院有限公司;中國廣核集團有限公司;中國廣核電力股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910604461.2/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優(yōu)化,例如線性規(guī)劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規(guī)劃、調度或分配時間、人員或機器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





