[發(fā)明專利]自動(dòng)本體生成的方法、系統(tǒng)和介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201780079370.0 | 申請(qǐng)日: | 2017-12-07 |
| 公開(kāi)(公告)號(hào): | CN110088749B | 公開(kāi)(公告)日: | 2023-05-26 |
| 發(fā)明(設(shè)計(jì))人: | M·奧伯霍菲爾;S·舒瑪徹;O·沃爾夫;M·考貝特;J·利姆伯恩 | 申請(qǐng)(專利權(quán))人: | 國(guó)際商業(yè)機(jī)器公司 |
| 主分類號(hào): | G06F16/36 | 分類號(hào): | G06F16/36;G06F16/25 |
| 代理公司: | 中國(guó)貿(mào)促會(huì)專利商標(biāo)事務(wù)所有限公司 11038 | 代理人: | 程晨 |
| 地址: | 美國(guó)*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自動(dòng) 本體 生成 方法 系統(tǒng) 介質(zhì) | ||
1.一種用于為整合和存儲(chǔ)來(lái)自多個(gè)不同數(shù)據(jù)源的數(shù)據(jù)集合自動(dòng)生成本體的計(jì)算機(jī)實(shí)現(xiàn)的方法,包括:
提供概念的語(yǔ)義網(wǎng)絡(luò)作為用于知識(shí)的目標(biāo)域的本體模板,其中所述概念被定義為基本實(shí)體類型;
基于對(duì)所述多個(gè)不同數(shù)據(jù)源內(nèi)的數(shù)據(jù)的分別由多個(gè)外鍵引用的數(shù)量確定的數(shù)據(jù)的流行度,從所述多個(gè)不同數(shù)據(jù)源中選擇數(shù)據(jù)邏輯分組的子集;
從所述多個(gè)不同數(shù)據(jù)源讀取選擇的數(shù)據(jù)邏輯分組和相關(guān)聯(lián)的技術(shù)元數(shù)據(jù);
應(yīng)用數(shù)據(jù)發(fā)現(xiàn)技術(shù)來(lái)檢測(cè)所述數(shù)據(jù)邏輯分組中的數(shù)據(jù)特性的語(yǔ)義和/或語(yǔ)法分類,其中所述數(shù)據(jù)發(fā)現(xiàn)技術(shù)包括:
識(shí)別所選擇的數(shù)據(jù)邏輯分組內(nèi)的已知概念的格式,以檢測(cè)指示對(duì)應(yīng)概念的數(shù)據(jù)特性的語(yǔ)義和語(yǔ)法分類;以及
基于所選擇的數(shù)據(jù)邏輯分組中滿足所檢測(cè)的數(shù)據(jù)特性分類的約束的值的數(shù)量來(lái)驗(yàn)證所檢測(cè)的所述數(shù)據(jù)特性的分類;
對(duì)于所述選擇的數(shù)據(jù)邏輯分組中的每一個(gè),生成具有用于所述數(shù)據(jù)特性的屬性的實(shí)體類型,并將生成的實(shí)體類型添加到所述語(yǔ)義網(wǎng)絡(luò),其中所述生成的實(shí)體類型具有從應(yīng)用的所述數(shù)據(jù)發(fā)現(xiàn)技術(shù)導(dǎo)出的屬性分類;
檢測(cè)所述生成的實(shí)體類型的語(yǔ)義含義,并將所述生成的實(shí)體類型與所述語(yǔ)義網(wǎng)絡(luò)中的其他實(shí)體類型相關(guān)聯(lián);
輸出所述語(yǔ)義網(wǎng)絡(luò)作為所述數(shù)據(jù)集合的結(jié)果本體;以及
從所述多個(gè)不同的數(shù)據(jù)源提取所述數(shù)據(jù)集合,并根據(jù)所述結(jié)果本體將所提取的數(shù)據(jù)存儲(chǔ)在集中式存儲(chǔ)庫(kù)中。
2.如權(quán)利要求1所述的方法,其中提供概念的語(yǔ)義網(wǎng)絡(luò)作為本體模板包括提供具有基于特性的屬性以及所述屬性的分類集合的基本實(shí)體類型,并且其中通過(guò)應(yīng)用數(shù)據(jù)發(fā)現(xiàn)技術(shù)檢測(cè)的所述分類是所述基本實(shí)體類型的分類。
3.如權(quán)利要求1或2所述的方法,其中生成具有用于所述數(shù)據(jù)特性的屬性的實(shí)體類型將來(lái)自所述相關(guān)聯(lián)的技術(shù)元數(shù)據(jù)的名稱用于所述生成的實(shí)體類型和屬性。
4.如權(quán)利要求1或2所述的方法,包括通過(guò)鏈接到數(shù)據(jù)源的技術(shù)元數(shù)據(jù),將具有存儲(chǔ)的譜系的生成的實(shí)體類型提供給所述生成的實(shí)體類型源自的數(shù)據(jù)源。
5.如權(quán)利要求4所述的方法,包括使用所述存儲(chǔ)的譜系來(lái)優(yōu)化跨數(shù)據(jù)源的所述數(shù)據(jù)邏輯分組的存儲(chǔ)。
6.如權(quán)利要求1或2所述的方法,其中檢測(cè)語(yǔ)義和/或語(yǔ)法分類包括基于對(duì)分類的約束的遵從性來(lái)提供正確分類的概率。
7.如權(quán)利要求1所述的方法,其中,檢測(cè)所述生成的實(shí)體類型的語(yǔ)義含義并將所述生成的實(shí)體類型與其他實(shí)體類型相關(guān)聯(lián)包括:
使用實(shí)體的公共屬性和/或分類來(lái)關(guān)聯(lián)實(shí)體類型。
8.如權(quán)利要求1或2所述的方法,其中將所述生成的實(shí)體類型與其他實(shí)體類型相關(guān)聯(lián)包括關(guān)聯(lián)類型和/或確定子類型和父類型。
9.如權(quán)利要求1或2所述的方法,包括優(yōu)化所述語(yǔ)義網(wǎng)絡(luò)以輸出結(jié)果本體,包括創(chuàng)建跨實(shí)體類型的公共和唯一屬性與分類的映射和/或提供實(shí)體類型的附加分類。
10.如權(quán)利要求1或2所述的方法,包括在所述本體的生成階段期間實(shí)現(xiàn)用戶查看和輸入,包括以下的一個(gè)或多個(gè)階段:
讀取數(shù)據(jù)邏輯分組,檢測(cè)數(shù)據(jù)特性的分類,生成實(shí)體類型,關(guān)聯(lián)實(shí)體類型,以及輸出所述結(jié)果本體。
11.如權(quán)利要求1或2所述的方法,其中所述方法作為在云環(huán)境中的服務(wù)提供。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國(guó)際商業(yè)機(jī)器公司,未經(jīng)國(guó)際商業(yè)機(jī)器公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780079370.0/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





