[發(fā)明專利]一種協(xié)作式的領域知識挖掘推理分析方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011593881.4 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112699167A | 公開(公告)日: | 2021-04-23 |
| 發(fā)明(設計)人: | 陳征宇;黃河;戴文艷;林文國;王偉宗;王孝文 | 申請(專利權)人: | 長威信息科技發(fā)展股份有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/215;G06F16/23;G06N5/02 |
| 代理公司: | 北京高航知識產(chǎn)權代理有限公司 11530 | 代理人: | 喬浩剛 |
| 地址: | 350001 福建省福州市鼓樓*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 協(xié)作 領域 知識 挖掘 推理 分析 方法 系統(tǒng) | ||
一種協(xié)作式的領域知識挖掘推理分析方法及系統(tǒng),包括;數(shù)據(jù)獲取系統(tǒng)、主領域構建系統(tǒng)和推理分析系統(tǒng);數(shù)據(jù)獲取系統(tǒng)與主領域構建系統(tǒng)通訊連接;推理分析系統(tǒng)與主領域構建系統(tǒng)通訊連接;數(shù)據(jù)獲取系統(tǒng)包括數(shù)據(jù)檢測模塊、數(shù)據(jù)對比模塊、數(shù)據(jù)獲取模塊、數(shù)據(jù)識別模塊、數(shù)據(jù)篩選模塊和數(shù)據(jù)更新模塊;主領域構建系統(tǒng)包括數(shù)據(jù)預處理模塊、數(shù)據(jù)清洗模塊、算法選取模塊、學習模擬模塊、規(guī)則提取模塊和模型構建模塊;本發(fā)明通過數(shù)據(jù)識別模塊識別數(shù)據(jù)中的有效數(shù)據(jù)和無效數(shù)據(jù)并進行標記并刪除無效數(shù)據(jù)以及排列保存有效數(shù)據(jù)進行;根據(jù)信息之間的聯(lián)系和規(guī)則,來建立相似的規(guī)律法則并提取出模擬出的規(guī)律算法;提高了知識挖掘的精確性和降低了知識挖掘的難度。
技術領域
本發(fā)明涉及知識挖掘技術領域,尤其涉及一種協(xié)作式的領域知識挖掘推理分析方法及系統(tǒng)。
背景技術
隨著互聯(lián)網(wǎng)的發(fā)展和普及,各種信息呈現(xiàn)了爆炸式增加;若通過人為的方式來獲取有用的信息費時費力,且非常困難;因此如何從海量的信息中獲取所需要的內容并能夠將獲取的內容以有用的知識呈現(xiàn),成為用戶普遍關注的焦點。現(xiàn)有的針對海量數(shù)據(jù)進行知識挖掘時,更側重根據(jù)已知的知識預先進行人工模型的建立,然后根據(jù)既定的人工模型進行知識挖掘;知識挖掘源于全球范圍內數(shù)據(jù)庫中存儲的數(shù)據(jù)量急劇增加,人們的需求已經(jīng)不只是簡單的查詢和維護,而是希望能夠對這些數(shù)據(jù)進行較高層次的處理和分析以得到關于數(shù)據(jù)總體特征和對發(fā)展趨勢的預測。知識挖掘最新的描述性定義是由UsamaM.Fayyyad等給出的:知識挖掘是從數(shù)據(jù)集中識別出有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程;知識挖掘已被越來越多的領域所采用,并取得了較好效果。這些領域有科學研究、市場營銷、金融投資、欺詐甄別、產(chǎn)品制造、通信網(wǎng)絡管理等。雖然知識挖掘已經(jīng)受到許多關注并取得了廣泛應用,但它仍處于發(fā)展的早期,還有很多研究難題和面臨的挑戰(zhàn),如數(shù)據(jù)挖掘的精度性,發(fā)現(xiàn)知識挖掘規(guī)律以及信息之間的聯(lián)系難度大。
發(fā)明內容
(一)發(fā)明目的
為解決背景技術中存在的技術問題,本發(fā)明提出一種協(xié)作式的領域知識挖掘推理分析方法及系統(tǒng),通過數(shù)據(jù)對比模塊實時更新網(wǎng)路中獲取的數(shù)據(jù),并與舊數(shù)據(jù)進行對比,檢測數(shù)據(jù)的真實性和精準性,通過數(shù)據(jù)識別模塊識別數(shù)據(jù)中的有效數(shù)據(jù)和無效數(shù)據(jù)并進行標記并分開再將無效數(shù)據(jù)刪除并對有效數(shù)據(jù)進行排列保存;通過數(shù)據(jù)清洗模塊發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識別的錯誤,包括檢查數(shù)據(jù)一致性,處理無效值和缺失值;通過算法選取模塊根據(jù)數(shù)據(jù)之間不同的關聯(lián)關系來獲取相對應的算法;根據(jù)信息之間的聯(lián)系和規(guī)則,來建立相似的規(guī)律法則并提取出模擬出的規(guī)律算法;利用知識挖掘模型,從結構化數(shù)據(jù)中提取出對應的目標信息;根據(jù)輔助的知識挖掘模型構建對應的知識挖掘模型,從而提高了知識挖掘的精確性和降低了知識挖掘的難度。
(二)技術方案
本發(fā)明提供了一種協(xié)作式的領域知識挖掘推理分析方法及系統(tǒng),包括數(shù)據(jù)獲取系統(tǒng)、主領域構建系統(tǒng)和推理分析系統(tǒng);數(shù)據(jù)獲取系統(tǒng)與主領域構建系統(tǒng)通訊連接;推理分析系統(tǒng)與主領域構建系統(tǒng)通訊連接;其中,數(shù)據(jù)獲取系統(tǒng)包括數(shù)據(jù)檢測模塊、數(shù)據(jù)對比模塊、數(shù)據(jù)獲取模塊、數(shù)據(jù)識別模塊、數(shù)據(jù)篩選模塊和數(shù)據(jù)更新模塊;主領域構建系統(tǒng)包括數(shù)據(jù)預處理模塊、數(shù)據(jù)清洗模塊、算法選取模塊、學習模擬模塊、規(guī)則提取模塊和模型構建模塊;
數(shù)據(jù)獲取模塊,用于從互聯(lián)網(wǎng)數(shù)據(jù)庫中獲取所需要的信息和數(shù)據(jù);
數(shù)據(jù)對比模塊,用于實時更新網(wǎng)路中獲取的數(shù)據(jù),并與舊數(shù)據(jù)進行對比;
數(shù)據(jù)檢測模塊,用于檢測數(shù)據(jù)的真實性和精準性,對保證數(shù)據(jù)精確度;
數(shù)據(jù)識別模塊,用于識別數(shù)據(jù)中的有效數(shù)據(jù)和無效數(shù)據(jù),并進行標記并分開;
數(shù)據(jù)篩選模塊,用于篩選出無效數(shù)據(jù)和有效數(shù)據(jù),將無效數(shù)據(jù)刪除并對有效數(shù)據(jù)進行排列保存;
數(shù)據(jù)更新模塊,用于將跟新的信息數(shù)據(jù)保存,并將跟新前的信息數(shù)據(jù)更換后再另行保存;
數(shù)據(jù)預處理模塊,用于對數(shù)據(jù)進行相關信息處理,輔助后期計算;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長威信息科技發(fā)展股份有限公司,未經(jīng)長威信息科技發(fā)展股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011593881.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于業(yè)務規(guī)則的跨部門流程協(xié)同方法
- 基站協(xié)作的動態(tài)連接方法、基站和協(xié)作多輸入多輸出系統(tǒng)
- 一種協(xié)作多點傳輸系統(tǒng)的信號發(fā)送方法及其裝置
- 協(xié)作方法、網(wǎng)絡和用戶終端
- 應用程序協(xié)作系統(tǒng)、應用程序協(xié)作方法以及應用程序協(xié)作程序
- 協(xié)作多點傳輸方法、裝置和系統(tǒng)
- 一種面向智能終端的內容下載應用激勵方法及其系統(tǒng)
- 一種協(xié)作多點傳輸調度方法及裝置
- 一種協(xié)作實現(xiàn)方法和裝置
- 一種區(qū)塊鏈及智能合約系統(tǒng)協(xié)作層設計





