[發明專利]句子相似度計算方法及裝置、計算機存儲介質和終端在審
| 申請號: | 201711178245.3 | 申請日: | 2017-11-23 |
| 公開(公告)號: | CN107992472A | 公開(公告)日: | 2018-05-04 |
| 發明(設計)人: | 張家重;趙亞歐;王玉奎 | 申請(專利權)人: | 浪潮金融信息技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06K9/62 |
| 代理公司: | 南京蘇科專利代理有限責任公司32102 | 代理人: | 姚姣陽 |
| 地址: | 215000 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 句子 相似 計算方法 裝置 計算機 存儲 介質 終端 | ||
1.一種句子相似度計算方法,其特征在于,包括:
計算第一語句與第二語句之間的淺層語義分析數值和詞語語義分析數值;
基于計算得到的淺層語義分析數值和詞語語義分析數值,計算得到所述第一語句與第二語句之間的相似度數值。
2.根據權利要求1所述的句子相似度計算方法,其特征在于,所述計算第一語句與第二語句之間的淺層語義分析數值,包括:
分別計算所述第一語句與所述第二語句所述之間的詞形相似度數值、詞序相似度數值、語句長度相似度數值和語句距離相似度數值;
基于計算得到的所述第一語句與所述第二語句所述之間的詞形相似度數值、詞序相似度數值、語句長度相似度數值和語句距離相似度數值,計算得到所述第一語句與所述第二語句之間的淺層語義分析數值。
3.根據權利要求2所述的句子相似度計算方法,其特征在于,所述基于計算得到的所述第一語句與所述第二語句之間的詞形相似度數值、詞序相似度數值、語句長度相似度數值和語句距離相似度數值,計算得到所述第一語句與所述第二語句之間的淺層語義分析數值,包括:
將計算得到的所述第一語句與所述第二語句之間的詞形相似度數值、詞序相似度數值、語句長度相似度數值和語句距離相似度數值進行加權平均,得到所述第一語句與所述第二語句之間的淺層語義分析數值。
4.根據權利要求1-3任一項所述的句子相似度計算方法,其特征在于,所述計算所述第一語句與所述第二語句之間的詞語語義分析數值,包括:
計算所述第一語句與所述第二語句之間的同義詞詞林相似度數值和詞對語句相似度數值;
基于計算得到的所述第一語句與所述第二語句之間的同義詞詞林相似度數值和詞對語句相似度數值,計算得到所述第一語句與所述第二語句之間的詞對語句相似度數值;
基于計算得到的所述第一語句與所述第二語句之間的詞對語句相似度數值,計算得到所述第一語句與所述第二語句之間的詞語語義分析數值。
5.根據權利要求4所述的句子相似度計算方法,其特征在于,所述計算所述第一語句與所述第二語句之間的同義詞詞林相似度數值,包括:
且:
N=5-H;
其中,S(w1,w2)表示所述第一語句與所述第二語句之間的同義詞詞林相似度數值,w1、w2分別表示待識別的語句與第二語句,c1和c2分別表示w1、w2在詞林中編號,H表示w1、w2之間的深度,sub(c1,n)、sub(c2,n)分別表示c1、c2編號的前n位,N表示w1、w2在同義詞詞林中的距離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮金融信息技術有限公司,未經浪潮金融信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711178245.3/1.html,轉載請聲明來源鉆瓜專利網。





