[發(fā)明專利]公共文化知識圖譜平臺及其使用辦法在審
| 申請?zhí)枺?/td> | 201611170815.X | 申請日: | 2016-12-16 |
| 公開(公告)號: | CN106815307A | 公開(公告)日: | 2017-06-09 |
| 發(fā)明(設(shè)計)人: | 王健;張桂剛;楊頤;黃衛(wèi)星 | 申請(專利權(quán))人: | 中國科學(xué)院自動化研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N5/02 |
| 代理公司: | 北京瀚仁知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)11482 | 代理人: | 郭文浩,李飛 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 公共 文化 知識 圖譜 平臺 及其 使用 辦法 | ||
1.一種公共文化知識圖譜平臺,其特征在于,包括:用于采集公共文化知識的采集處理系統(tǒng),用于存儲經(jīng)所述采集處理系統(tǒng)所采集處理后的公共文化知識的存儲處理系統(tǒng),用于將所述存儲處理系統(tǒng)所存儲的公共文化知識進(jìn)行分析處理的分析處理系統(tǒng),提供公共文化知識查詢的服務(wù)處理系統(tǒng)和對各處理系統(tǒng)實現(xiàn)調(diào)配管理的管理系統(tǒng)。
2.根據(jù)權(quán)利要求1所述的公共文化知識圖譜平臺,其特征在于,所述采集處理系統(tǒng)包括數(shù)據(jù)采集處理模塊、知識模板模塊和知識挖掘模塊;
所述數(shù)據(jù)采集處理模塊,具體包括用于采集所有數(shù)據(jù)源并對其進(jìn)行相應(yīng)處理;
所述知識模板模塊,用于在所述數(shù)據(jù)采集處理模塊處理數(shù)據(jù)源時提供模板支持作為判定依據(jù);
所述知識挖掘模塊,用于在所述數(shù)據(jù)采集處理模塊處理的數(shù)據(jù)中進(jìn)行公共文化知識挖掘。
3.根據(jù)權(quán)利要求2所述的公共文化知識圖譜平臺,其特征在于,所述數(shù)據(jù)采集處理模塊具體包括采集單元、數(shù)據(jù)清洗單元、數(shù)據(jù)轉(zhuǎn)換單元、判定器單元和自然語言處理單元,
所述采集單元,用于采集數(shù)據(jù)源;
所述數(shù)據(jù)清洗單元,用于將所述采集單元所采集的所有數(shù)據(jù)源進(jìn)行噪聲數(shù)據(jù)消除和數(shù)據(jù)消重處理;
所述判定器單元,用于對所述數(shù)據(jù)清洗單元處理前的數(shù)據(jù)進(jìn)行有效性判定,當(dāng)判定結(jié)果為無效數(shù)據(jù)時,由所述數(shù)據(jù)清洗單元進(jìn)行數(shù)據(jù)清洗;否則,保留數(shù)據(jù);
所述數(shù)據(jù)轉(zhuǎn)換單元,用于將經(jīng)所述數(shù)據(jù)清洗單元清洗后的數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換;
所述自然語言處理單元,用于將經(jīng)所述數(shù)據(jù)轉(zhuǎn)換單元格式轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行自然語言處理后存儲。
4.根據(jù)權(quán)利要求3所述的公共文化知識圖譜平臺,其特征在于,所述知識挖掘模塊具體包括知識抽取單元、知識融合單元、知識擴展單元和知識驗證單元,
所述知識抽取單元與所述語言處理單元通信連接,用于將經(jīng)所述自然語言處理單元自然語言處理后得到的數(shù)據(jù)中提取出公共文化實體,以及實體之間的語義關(guān)系;
所述知識融合單元,用于對相同實體或相似實體的融合、相同實體屬性或相似實體屬性的融合,以及相同實體關(guān)系或相似實體關(guān)系的融合;
所述知識擴展單元,用于對所述存儲處理系統(tǒng)中所存儲的公共文化知識進(jìn)行數(shù)據(jù)擴展挖掘;
所述知識驗證單元,用于對經(jīng)所述知識融合單元和所述知識擴展單元處理后的公共文化知識進(jìn)行驗證,驗證后的公共文化知識由所述存儲處理系統(tǒng)保存。
5.根據(jù)權(quán)利要求1所述的公共文化知識圖譜平臺,其特征在于,所述存儲處理系統(tǒng)用于分類存儲所有的公共文化知識數(shù)據(jù),包括存儲各種結(jié)構(gòu)化數(shù)據(jù)的第一存儲模塊、存儲圖片、視頻數(shù)據(jù)的第二存儲模塊、存儲知識圖譜模型的第三存儲模塊、存儲文本文檔的第四存儲模塊、存儲本體模型和規(guī)則模板的第五存儲模塊以及存儲系統(tǒng)數(shù)據(jù)的第六存儲模塊。
6.根據(jù)權(quán)利要求5所述的公共文化知識圖譜平臺,其特征在于,所述第一存儲模塊具體為關(guān)系型數(shù)據(jù)庫集群,所述第二存儲模塊具體為分布式文件系統(tǒng),所述第三存儲模塊具體為圖數(shù)據(jù)庫,所述第四存儲模塊具體為文檔數(shù)據(jù)庫,所述第五存儲模塊具體為可擴展標(biāo)記語言XML,以及所述第六存儲模塊具體為列數(shù)據(jù)庫。
7.根據(jù)權(quán)利要求1所述的公共文化知識圖譜平臺,其特征在于,所述公共文化知識圖譜平臺還包括與所述管理系統(tǒng)通信連接的調(diào)配處理系統(tǒng),所述調(diào)配處理系統(tǒng)用于根據(jù)所述管理系統(tǒng)的指示對其所連接的各處理系統(tǒng)進(jìn)行統(tǒng)一調(diào)配處理。
8.根據(jù)權(quán)利要求7所述的公共文化知識圖譜平臺,其特征在于,所述調(diào)配處理系統(tǒng)中還包括用于為所述分析處理系統(tǒng)提供數(shù)據(jù)分析時所需使用計算框架的計算框架模塊,為所述分析處理系統(tǒng)提供數(shù)據(jù)分析時所需使用算法的算法庫模塊,以及為所述存儲處理系統(tǒng)中所存儲的模型提供配置的模型管理模塊。
9.一種基于權(quán)利要求1-8所述的公共文化知識圖譜平臺的使用方法,其特征在于,包括:
接收公共文化知識的查詢請求;
根據(jù)所述查詢請求查詢公共文化知識;
將查詢到的公共文化知識進(jìn)行展示。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動化研究所,未經(jīng)中國科學(xué)院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611170815.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





