[發明專利]基于本體概念求解語義相似度的混合方法在審
| 申請號: | 201610833689.5 | 申請日: | 2016-09-20 |
| 公開(公告)號: | CN106610944A | 公開(公告)日: | 2017-05-03 |
| 發明(設計)人: | 金平艷 | 申請(專利權)人: | 四川用聯信息技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610054 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 本體 概念 求解 語義 相似 混合 方法 | ||
1.基于本體概念求解語義相似度的混合方法,本發明涉及語義網絡技術領域,具體涉及一種基于本體概念求解語義相似度的混合方法,其特征是,包括如下步驟:
步驟1:初始化統計方法模塊
步驟2:將待比較詞輸入初始化統計方法模塊中
步驟3:將待比較詞映射到本體概念模塊中
步驟4:分別選取待比較詞對應深度最大的本體概念
步驟5:計算待比較詞對應深度最大的兩本體概念間的相似度
步驟6:待比較詞之間的詞形相似度
步驟7:待比較詞之間的詞序相似度
步驟8:經過上述步驟,計算兩待比較詞最近共同祖先的深度密度對兩待比較詞相似度的影響,構造影響因子函數
步驟9:綜合上述步驟,計算兩待比較詞的相似度。
2.根據權利要求1中所述的基于本體概念求解語義相似度的混合方法,其特征是,以上所述步驟7中的具體計算過程如下:
步驟7:待比較詞之間的詞序相似度,其具體計算過程如下:
這當待比較詞所含有相同的詞性時,詞序的相同與否反映待比較詞的語義相似度,所以詞序相似度反映了待比較詞所包含相同詞性在位置順序關系上的相似程度,用待比較詞中所包含的相同詞性相鄰順序逆向的個數來衡量,計算公式如下:
根據待比較可得
為中的詞性相同詞在中的位置順序構成的自然數序列的逆序數,反之,為中的詞性相同詞在中的位置順序構成的自然數序列的逆序數,從而得下式:
上式為待比較詞中詞性相同的詞個數n的最大逆序數。
3.根據權利要求1中所述的基于本體概念求解語義相似度的混合方法,其特征是,以上所述步驟8中的具體計算過程如下:
步驟8:經過上述步驟,計算兩待比較詞最近共同祖先的深度深度對兩待比較詞相似度的影響,構造影響因子函數目標影響函數其具體計算過程如下:
步驟8.1)根據模塊,可以找到兩待比較詞最近共同祖先的深度
這里兩待比較詞最近共同祖先深度越靠近底層,代表兩待比較詞越相近
這里可以構造兩因子,即:
根據兩因子得到深度對兩待比較詞相似度的影響,有下式:
步驟8.2)同理,根據模塊,可以找到兩待比較詞最近共同祖先的密度
這里兩待比較詞最近共同祖先密度越大,代表兩待比較詞越相近
構造兩因子,即:
根據兩因子得到密度對兩待比較詞相似度的影響,有下式:
綜合步驟8.1)、步驟8.2)可得下式目標影響函數
上式分別為深度深度的權重系數,為深度深度對詞語相似度的影響系數,其取值可以通過試驗得到,這里越大則表示詞語共同祖先的深度對相似度的影響越大,反之影響越小,同理。
4.根據權利要求1中所述的基于本體概念求解語義相似度的混合方法,其特征是,以上所述步驟9中的具體計算過程如下:
步驟9:綜合上述步驟,計算兩待比較詞的相似度其具體求解過程如下:
上式
A+B+C=1,A、B、C分別為兩本體概念間的相似度目標影響函數加權系數,值越大,對兩待比較詞的相似度影響也越大,它們可以根據實驗得到。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川用聯信息技術有限公司,未經四川用聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610833689.5/1.html,轉載請聲明來源鉆瓜專利網。





