[發明專利]一種基于隨機游走的醫藥領域知識推理方法在審
| 申請號: | 201910876121.5 | 申請日: | 2019-09-17 |
| 公開(公告)號: | CN110609907A | 公開(公告)日: | 2019-12-24 |
| 發明(設計)人: | 張吉昕;秦拯;歐露;顏俊;陳浩;歐博;翟亞靜 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/33;G16H70/00;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 410082 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫藥領域 命名實體 推理 圖譜 隨機游走 抽取 實體間關系 情感分類 自動構建 二元組 信息熵 謂詞 | ||
本發明涉及一種基于隨機游走的醫藥領域知識推理方法。其發明內容主要包括(1)基于上下文字符二元組和信息熵的醫藥領域命名實體識別方法;(2)基于謂詞情感分類的醫藥領域實體間關系抽取方法;(3)基于隨機游走的醫藥領域知識圖譜推理方法。基于上述方法,識別醫藥領域命名實體、抽取命名實體間關系,從而自動構建醫藥領域知識圖譜,并實現醫藥領域知識圖譜推理。
技術領域
本發明涉及知識工程和機器學習領域,一種基于隨機游走的醫藥領域知識推理方法。
背景技術
知識圖譜技術作為知識工程和人工智能領域的關鍵技術之一,是當前熱門的技術研究領域之一。不同于機器學習技術,往往存在特征間局部關系難解釋以及特征與輸出間全局關系難解釋的問題,知識圖譜技術通過三元組表示知識實體間關系,直觀的反映知識本體和知識實體間關聯邏輯,具有很好的可解釋性,已得到工業界越來越多的重視,成為人工智能技術的重要基礎之一。
知識圖譜技術主要包括構建、推理等方面,其中,知識圖譜構建技術主要包括命名實體識別、關系抽取等,知識圖譜推理技術主要包括實體關系預測、知識推理等。通過從文本數據中的事實中識別知識實體、抽取知識實體間的關系,并基于三元組表示法構建知識圖譜,并通過挖掘和預測可能存在的實體間關系來對知識圖譜進行補全,基于知識圖譜中已知的實體間關系進行知識規則的提取與推理。
醫藥領域作為知識密集型領域,十分依賴醫學、藥學背景知識,利用知識圖譜表示醫學、藥學背景知識,對醫藥領域的輔助智能應用有著十分重要的支撐作用。然而,醫藥領域的命名實體、實體間關系、知識邏輯等具有十分鮮明的領域特點,相較于通用領域有著較大差異,需要提出有針對性的知識圖譜構建與推理技術支撐知識圖譜在醫藥領域中的輔助智能應用。
發明內容
本發明目的旨在解決醫藥知識圖譜自動構建和推理問題。
為此,本發明提出了一種基于隨機游走的醫藥領域知識推理方法,主要包括三部分內容:
(1)基于上下文字符二元組和信息熵的醫藥領域命名實體識別方法;
(2)基于謂詞情感分類的醫藥領域實體間關系抽取方法;
(3)基于隨機游走的醫藥領域知識圖譜推理方法。
具體內容如下:
采用方法(1)識別醫藥領域命名實體,包括藥品、疾病、癥狀、人群、成分等概念;采用方法(2)抽取醫藥領域命名實體間的正向關系和負向關系,包括適用、禁忌等關系;利用醫藥領域命名實體和實體間關系自動構建醫藥知識圖譜,并采用方法(3)實現醫藥知識圖譜推理。基于上述方法實現醫藥知識圖譜自動構建以及醫藥領域知識推理。
(1)基于上下文字符二元組和信息熵的醫藥領域命名實體識別方法。
收集常規語料和醫藥專業語料,去掉其中標點符號和停用詞,根據醫藥語料和常規預料庫中上下文分別建立了兩個字符轉移概率矩陣,矩陣中的每個元素是上下文中的轉移頻率值。令Matmedical為醫藥語料的上下文字符轉移概率矩陣,Matnormal為常規語料的上下文字符轉移概率矩陣,令{ci,ci+1}為語料中連續的字符上下文,通過分別計算{ci,ci+1}在醫藥語料和常規語料中轉移概率,我們得到矩陣Matmedical(ci,ci+1)和矩陣Matnormal(ci,ci+1)。
基于醫藥語料和常規語料的上下文字符轉移概率矩陣,采用信息熵計算每組字符上下文屬于醫藥領域的顯著程度,由于常規語料中的字符轉移概率比較穩定,醫藥語料中顯著偏離常規語料字符轉移概率的字符上下文則判定醫藥命名實體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910876121.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:知識圖譜構建方法及裝置、存儲介質及電子終端
- 下一篇:案件串并方法及裝置





