[發明專利]一種基于人工智能的跨領域知識圖譜構建方法及裝置在審
| 申請號: | 202010198698.8 | 申請日: | 2020-03-20 |
| 公開(公告)號: | CN111428048A | 公開(公告)日: | 2020-07-17 |
| 發明(設計)人: | 洪萬福;王彬;周瑞 | 申請(專利權)人: | 廈門淵亭信息科技有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/25 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 361000 福建省廈門市思明*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 人工智能 領域 知識 圖譜 構建 方法 裝置 | ||
1.一種基于人工智能的跨領域知識圖譜構建方法及裝置,其特征在于,包括:知識模型,多源異構,知識數據抽取,跨領域本體融合;
所述知識模型指構建知識圖譜的數據模型,通過TOVD構建方法進行本體構建,用以描述概念層次體系和知識庫中知識的概念模板;
使用戶清楚各種本體之間的關系,以及本體包含的標簽和屬性要素;
所述多源異構是指用于對來自于不同的信息源或者數據管理系統對其所包含的多方面特征進行充分的分析然后才能有效的對其進行融合操作;
所述知識數據抽取是面向開放的鏈接數據,通過自動化的技術抽取出可用的知識單元,知識單元主要包括實體(概念的外延)、關系以及屬性等知識要素,并以此為基礎,形成一系列高質量的事實表達,為模型層的構建奠定基礎;
所述跨領域本體融合是指將多行業領域構建的本體庫抽取進行融合,其中包括30+融合策略(實體鏈接,屬性歸一,沖突解決,知識補全,更新審核等內容)。
2.如權利要求1所述的一種基于人工智能的跨領域知識圖譜構建方法及配置,其特征在于:
所述知識模型還包括:根據具體的應用領域和需要解決的問題以及實施過程進行分析,采用手工建模和半自動化建模針對全局本體庫從多個行業領域的本體庫出發,用以約束知識圖譜數據的組織方式。
3.如權利要求1所述的一種基于人工智能的跨領域知識圖譜構建方法及配置,其特征在于:
所述多源異構包括:支持多源異構的數據源管理,目前已支持的數據源類型主要有關系型數據源、分布式文件數據源、分布式hive數據源、分布式hbase數據源、非關系型數據源(mongodb)等,從這些數據源中提取實體關系和事件信息,并對這些信息進行計算生成新的標簽和信息,同時需要能處理全量數據、增量數據;
異構性,在數據融合系統中進行融合處理的數據往往是來自于多個相互獨立的系統產生的數據;
分布性,多源異構數據的數據源往往是異地分布的,有些數據之間的交互是通過網絡傳輸的,存在網絡傳輸性能和安全性等問題;
自治性:由于有些數據的來源可能是來自一些獨立的系統,在這些相互獨立的系統具有很強的自治性;
根據對多源異構數據融合的特征進行分析,融合系統中異構數據的主要表現分為語法異構和語義異構兩種;
語法異構主要是指在領域內相同的對象和事實以不同的方式進行描述,
而語義異構主要出現在不同系統對相同信息做出了不一樣的解釋。
4.如權利要求1所述的一種基于人工智能的跨領域知識圖譜構建方法及配置,其特征在于:
所述知識數據抽取還包括:結構化數據抽取中提供可視化的Schema設計器便于進行數據抽取和Schema結構更改;
支持單機/分布式存儲的文件導入,非結構化抽取支持短文本、咨詢、報道、制式公文等格式抽取;
半結構化抽取配合爬蟲功能實現更強大的數據源抽取圖譜功能;
實體的抽取:選擇對應的數據源,建立科學完整的命名實體分類體系,基于歸納總結的實體類別和條件隨機場模型進行實體邊界識別,采用自適應感知機實現對實體的自動分類和統計機器學習的方法,從目標數據集中抽取出與之具有相似上下文特征的實體,從而實現實體的分類和聚類,用于自動補全技術,獲取新出現的命名實體;
屬性的抽取:是從不同信息源中采集特定實體的屬性信息,分為預定義抽取和開放域抽取,如針對某個公眾人物,可以從網絡公開信息中得到其昵稱、生日、國籍、教育背景等信息;
關系的抽取:經過實體抽取,得到的是一系列離散的命名實體,為了得到語義信息,還需要從相關語料中提取出實體之間的關聯關系,通過關系將實體聯系起來,形成網狀的知識結構。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門淵亭信息科技有限公司,未經廈門淵亭信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010198698.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種橡膠汽車配件材質
- 下一篇:預制模板和預制承臺胎膜及其施工方法





