[發(fā)明專利]一種基于本體語義相似度的醫(yī)學問答方法有效
| 申請?zhí)枺?/td> | 201910867117.2 | 申請日: | 2019-09-12 |
| 公開(公告)號: | CN110706807B | 公開(公告)日: | 2021-02-12 |
| 發(fā)明(設計)人: | 郭新龍 | 申請(專利權)人: | 北京四海心通科技有限公司 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G06F16/33;G06F16/332 |
| 代理公司: | 北京市廣友專利事務所有限責任公司 11237 | 代理人: | 張仲波 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 本體 語義 相似 醫(yī)學 問答 方法 | ||
本發(fā)明提供一種基于本體語義相似度的醫(yī)學問答方法,通過將醫(yī)學領域用戶常見問題與語義分析,語義相似度計算,本體等相關技術結合,提出了一種綜合的語義相似度計算方法,并結合淺層語義分析和文本分析技術,提出了基于語義相似度的醫(yī)學問答方法。本發(fā)明中的語義相似度計算方法結合了句子表層的相似度,如句長,詞性等,以及基于概念詞的語義相似度,并且對于概念詞相似度的計算采用了屬性和距離綜合的方法。使得本發(fā)明的醫(yī)學問答系統(tǒng)可實現(xiàn)五大類問題(方式、時間、程度、數(shù)量、實體)處理,達到80%以上的準確率。五類問題基本涵蓋基礎醫(yī)學領域的學科問題,較好地實現(xiàn)了系統(tǒng)的功能。
技術領域
本發(fā)明涉及問答系統(tǒng)技術領域,特別是指一種基于本體語義相似度的醫(yī)學問答方法。
背景技術
問答系統(tǒng)是融合了自然語言處理和信息檢索技術的產(chǎn)品。根據(jù)涉及范圍的不同,可以分為開放領域和限定領域兩個大類。當前領域本體在問答系統(tǒng)中的應用主要體現(xiàn)在對領域概念的分類方面,缺乏對用戶問句的語義理解和處理。
此外,自然語言處理會涉及到語義相似度的計算,其定義如下:
Dekang Lira認為任何兩個詞語的相似度取決于它們的共性(Commonality)和個性(Differences),然后從信息論的角度給出了定義公式:
其中,分子表示描述A,B共性所需要的信息量;分母表示完整地描述A,B所需要的信息量。劉群、李素建以基于實例的機器翻譯為背景,認為語義相似度就是兩個詞語在不同的上下文中可以互相替換使用而不改變文本的句法語義結構的程度。兩個詞語,如果在不同的上下文中可以互相替換且不改變文本的句法語義結構的可能性越大,二者的相似度就越高,否則相似度就越低。對于兩個詞語W1、W2,如果記其相似度為Sim(W1,W2),其詞語距離為Dis(Wl,W2),根據(jù)劉群、李素建的公式:
其中是α一個可調(diào)節(jié)的參數(shù)。n的含義是當相似度為0.5時的詞語距離值。
詞語距離和詞語相似度是一對詞語的相同關系特征的不同表現(xiàn)形式,如果兩個概念之間的語義距離越近,就認為它們越相似,因此二者之間可以給出一個簡單對應關系:
其中,Dis(W1,W2)為數(shù)中W1、W2所代表的結點在數(shù)中的距離,k為比例系數(shù)。
一般地說,相似度一般被定義為一個0到1之間的實數(shù)。特別地,當兩個詞語完全一樣時,它們的相似度為1;當兩個詞語是完全不同的概念時,它們的相似度接近于0。
目前,關于語義相似度的計算主要有以下方式:
1、基于句法結構的相似度算法
基于樹的語義相似度計算的算法大體上分為兩種:一是基于距離的語義相似性測度;二是基于信息內(nèi)容的語義相似性測度。一般是利用一部語義詞典(如Wordnet,Hownet),語義詞典都是將所有的詞組織在一棵或幾棵樹狀的層次結構中。在一棵樹狀圖中,任何兩個結點之間有且只有一條路徑。于是,這條路徑的長度就可以作為這兩個詞語概念間語義距離的一種度量;而且隨著概念所處結點越深,其所包含的語義信息越豐富,越能準確地決定概念的性質(zhì),它們對語義相似度起著決定作用。
2、基于本體的語義相似度算法
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京四海心通科技有限公司,未經(jīng)北京四海心通科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910867117.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





