[發(fā)明專利]一種寵物知識圖譜的半自動化構(gòu)建方法有效
| 申請?zhí)枺?/td> | 201811336225.9 | 申請日: | 2018-11-09 |
| 公開(公告)號: | CN109471949B | 公開(公告)日: | 2022-12-27 |
| 發(fā)明(設(shè)計)人: | 袁琦 | 申請(專利權(quán))人: | 袁琦 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/295;G06F16/901 |
| 代理公司: | 南京禹為知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 32272 | 代理人: | 王曉東 |
| 地址: | 214122 江蘇*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 寵物 知識 圖譜 半自動 構(gòu)建 方法 | ||
本發(fā)明公開了一種寵物知識圖譜的半自動化構(gòu)建方法,包括,第一步,構(gòu)建Schema層,采用自頂而下的方式構(gòu)建寵物知識圖譜;第二步,數(shù)據(jù)的抽取,包括從半結(jié)構(gòu)化數(shù)據(jù)中抽取和從非結(jié)構(gòu)化數(shù)據(jù)中抽取;第三步,知識表示,選擇OrientDB原生圖數(shù)據(jù)支持的屬性圖模型來進行知識表示;第四步,知識存儲,將獲取的數(shù)據(jù)通過OrientDB圖數(shù)據(jù)庫存儲。填補了國內(nèi)在寵物領(lǐng)域知識圖譜的缺失。該知識庫為寵物領(lǐng)域知識的應(yīng)用提供了語料基礎(chǔ),為寵物領(lǐng)域問答機器人奠定了基礎(chǔ),具有重要意義。
技術(shù)領(lǐng)域
本發(fā)明涉及寵物管理的技術(shù)領(lǐng)域,特別是,涉及一種寵物知識圖譜的半自動化構(gòu)建方法。
背景技術(shù)
隨著經(jīng)濟社會的發(fā)展,寵物越來越多地出現(xiàn)在人們生活當中,家庭結(jié)構(gòu)和人口結(jié)構(gòu)的變化使得寵物進入了更多的家庭。據(jù)京東《2017寵物消費趨勢報告》的分析,目前中國寵物已經(jīng)突破1億只。互聯(lián)網(wǎng)是人們很重要的獲取寵物百科知識和寵物醫(yī)療知識的來源之一。大多數(shù)的寵物主人缺乏寵物知識,當他們需要了解這方面的知識的時候,大多的寵物主人主要是通過互聯(lián)網(wǎng)上Google和百度之類的搜索引擎來獲取知識。然而這會花費寵物主人很多時間來判斷哪些內(nèi)容包含了自己想要的信息,很多時候,用戶想要獲取進一步的知識,還需要自己再一次的閱讀和篩選。這導致了信息檢索的效率比較低下,用戶會對搜索引擎返回的大量信息感到迷茫。因此人們對可以提交用自然語言表達的寵物相關(guān)問題,系統(tǒng)會返回相關(guān)又準確的答案的問答系統(tǒng)有著非常迫切的需求。目前基于知識庫的問答聊天機器人有微軟小冰、百度的度秘等等。因此構(gòu)建關(guān)于寵物知識庫對實現(xiàn)智能問答有研究意義和應(yīng)用價值。
目前國內(nèi)外大型互聯(lián)網(wǎng)公司紛紛推出知識圖譜以改善服務(wù)質(zhì)量,同時當今也涌現(xiàn)出了人類醫(yī)學的知識圖譜,并且發(fā)展迅速。但在寵物領(lǐng)域尚未出現(xiàn)成熟、專業(yè)的知識圖譜。
發(fā)明內(nèi)容
本部分的目的在于概述本發(fā)明的實施例的一些方面以及簡要介紹一些較佳實施例。在本部分以及本申請的說明書摘要和發(fā)明名稱中可能會做些簡化或省略以避免使本部分、說明書摘要和發(fā)明名稱的目的模糊,而這種簡化或省略不能用于限制本發(fā)明的范圍。
鑒于上述和/或現(xiàn)有技術(shù)中存在的問題,提出了本發(fā)明。
因此,本發(fā)明其中一個目的是提供一種寵物知識圖譜的半自動化構(gòu)建方法。
為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:一種寵物知識圖譜的半自動化構(gòu)建方法,包括,第一步,構(gòu)建Schema層,采用自頂而下的方式構(gòu)建寵物知識圖譜;第二步,數(shù)據(jù)的抽取,包括從半結(jié)構(gòu)化數(shù)據(jù)中抽取和從非結(jié)構(gòu)化數(shù)據(jù)中抽取,所述從半結(jié)構(gòu)化數(shù)據(jù)中抽取是從半結(jié)構(gòu)化的數(shù)據(jù)源中進行實體、關(guān)系和屬性的抽取,所述從非結(jié)構(gòu)化數(shù)據(jù)中抽取是從非結(jié)構(gòu)化的數(shù)據(jù)中進行命名實體識別和抽取;第三步,知識表示,選擇OrientDB原生圖數(shù)據(jù)支持的屬性圖模型來進行知識表示;第四步,知識存儲,將獲取的數(shù)據(jù)通過OrientDB圖數(shù)據(jù)庫存儲。
作為本發(fā)明寵物知識圖譜的半自動化構(gòu)建方法的一種優(yōu)選方案,其中:所述Schema層,包括寵物品種、寵物疾病、疾病癥狀和寵物食物。
作為本發(fā)明寵物知識圖譜的半自動化構(gòu)建方法的一種優(yōu)選方案,其中:所述寵物品種的屬性定義包括中文名、別名、體型、毛長、英文名、智商、原產(chǎn)地、體重、壽命、價格、肩高、毛色和功能;所述寵物疾病的屬性定義包括科屬、概述、發(fā)病原因、診斷標準、治療方法和防治方法;所述寵物食物的屬性定義為可食性。
作為本發(fā)明寵物知識圖譜的半自動化構(gòu)建方法的一種優(yōu)選方案,其中:所述Schema層根據(jù)所述寵物品種、所述寵物疾病、所述疾病癥狀和所述寵物食物之間的關(guān)系分為三種定義語義關(guān)系,分別為,所述寵物品種與所述寵物疾病之間存在關(guān)系,定義為有疾病;所述寵物疾病與所述疾病癥狀之間存在關(guān)系,有癥狀;所述寵物品種與所述寵物食物之間存在關(guān)系,吃食物。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于袁琦,未經(jīng)袁琦許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811336225.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





