[發明專利]一種寵物知識圖譜的半自動化構建方法有效
| 申請號: | 201811336225.9 | 申請日: | 2018-11-09 |
| 公開(公告)號: | CN109471949B | 公開(公告)日: | 2022-12-27 |
| 發明(設計)人: | 袁琦 | 申請(專利權)人: | 袁琦 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/295;G06F16/901 |
| 代理公司: | 南京禹為知識產權代理事務所(特殊普通合伙) 32272 | 代理人: | 王曉東 |
| 地址: | 214122 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 寵物 知識 圖譜 半自動 構建 方法 | ||
1.一種寵物知識圖譜的半自動化構建方法,其特征在于:包括,
第一步,構建Schema層,采用自頂而下的方式構建寵物知識圖譜;
所述Schema層,包括寵物品種、寵物疾病、疾病癥狀和寵物食物,從非結構化數據中抽取,采用CRF與癥狀詞典結合的方法;
CRF可以看做是一種無向圖模型,常用的CRF模型是線性鏈CRF, 給定輸入句子中的單詞序列作為觀測序列o,S表示對應的輸出標記序列,CRF定義了S的條件概率分布p(s|o),通過訓練求得p(s|o)為最大值時的狀態序列S, 線性鏈CRF中的輸出序列S的條件概率公式如下:
所述寵物品種的屬性定義包括中文名、別名、體型、毛長、英文名、智商、原產地、體重、壽命、價格、肩高、毛色和功能;
所述寵物疾病的屬性定義包括科屬、概述、發病原因、診斷標準、治療方法和防治方法;
所述寵物食物的屬性定義為可食性;
所述Schema層根據所述寵物品種、所述寵物疾病、所述疾病癥狀和所述寵物食物之間的關系分為三種定義語義關系,分別為,
所述寵物品種與所述寵物疾病之間存在關系,定義為有疾病;
所述寵物疾病與所述疾病癥狀之間存在關系,有癥狀;
所述寵物品種與所述寵物食物之間存在關系,吃食物;
從半結構化數據中抽取,是指從網頁中提取網頁正文,抽取寵物品種以及屬性、寵物疾病以及屬性、寵物食物以及食物屬性的實體;
所述從非結構化數據中抽取,采用條件隨機場與癥狀詞典結合的方法;
第二步,數據的抽取,包括從半結構化數據中抽取和從非結構化數據中抽取,所述從半結構化數據中抽取是從半結構化的數據源中進行實體、關系和屬性的抽取,所述從非結構化數據中抽取是從非結構化的數據中進行命名實體識別和抽取;
第三步,知識表示,選擇OrientDB原生圖數據支持的屬性圖模型來進行知識表示;
第四步,知識存儲,將獲取的數據通過OrientDB圖數據庫存儲。
2.根據權利要求1所述的寵物知識圖譜的半自動化構建方法,其特征在于:所述知識表示,將所述知識圖譜模型通過W3C提出的資源描述框架或者屬性圖來表示。
3.根據權利要求1或2所述的寵物知識圖譜的半自動化構建方法,其特征在于:所述知識存儲,是將獲取的Schema層數據和實例層數據進行知識的整合和存儲,所述存儲的語言使用類SQL。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于袁琦,未經袁琦許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811336225.9/1.html,轉載請聲明來源鉆瓜專利網。





