[發明專利]文本信息匹配度量的方法、裝置、服務器及存儲介質有效
| 申請號: | 201910521519.7 | 申請日: | 2019-06-17 |
| 公開(公告)號: | CN110413988B | 公開(公告)日: | 2023-01-31 |
| 發明(設計)人: | 陳閩川;馬駿;王少軍 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/30;G06N3/04 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 高茹 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 信息 匹配 度量 方法 裝置 服務器 存儲 介質 | ||
本發明涉及人工智能領域,公開了一種文本信息匹配度量的方法,所述文本信息匹配度量的方法包括:在接收到目標文本和相似文本時,讀取目標文本和相似文本中的字詞粒度;根據讀取到的目標文本的字詞粒度和相似文本的字詞粒度,獲取目標文本的向量表征信息和相似文本的向量表征信息;當將目標文本的向量表征信息和相似文本的向量表征信息作為預置孿生網絡模型的輸入值時,獲取預置孿生網絡模型計算的目標文本與相似文本的相似度;在獲取到目標文本與相似文本之間的相似度時,匹配與目標文本相似度最高的相似文本。本發明還公開了一種裝置、服務器及存儲介質。實現了基于詞語和單字集成的文本相似度匹配算法,進一步提高句子語義分析效果。
技術領域
本發明涉及智能推薦領域,尤其涉及一種文本信息匹配度量的方法、裝置、服務器及計算機可讀存儲介質。
背景技術
最近幾年隨著word2vec和GloVe等詞語分布表示工具的出現和完善,詞語的表示信息越來越豐富,每個詞向量不僅包含較為豐富的語義信息,同時每個詞向量之間還存在一定的關系,可以通過簡單的運算來得到預料中未包含詞語的向量信息。自2012年來,卷積神經網絡(convolutional neural networks,CNN)模型在圖像識別中大放異彩,更多的研究者們開始將CNN模型移植到自然語言處理的任務上來,以獲取不同文本之間的相似度。
目前業內的問題相似度算法主要包括:1、在平均詞嵌入之間求余弦相似性的基準方法;2、詞移距離:使用兩文本間的詞嵌入,測量其中一文本中的單詞在語義空間中移動到另一文本單詞所需要的最短距離;3、Smooth Inverse Frequency對每個詞嵌入賦予不同的權重。但這些方法存在基于句子詞語的相似度量仍存在無法比較準確,且語義的剝離往往有較大偏差。
發明內容
本發明的主要目的在于提供一種文本信息匹配度量的方法,旨在解決在相似度算法中獲取文本的語義往往有較大偏差,導致相似度度量不準確的技術問題。
為實現上述目的,本發明提供一種文本信息匹配度量的方法,所述文本信息匹配度量的方法包括:
在接收到目標文本和相似文本時,讀取所述目標文本和所述相似文本中的字詞粒度,其中所述相似文本至少為一個;
根據讀取到的所述目標文本的字詞粒度和所述相似文本的字詞粒度,獲取所述目標文本的向量表征信息和所述相似文本的向量表征信息;
當將所述目標文本的向量表征信息和所述相似文本的向量表征信息作為預置孿生網絡模型的輸入值時,獲取所述預置孿生網絡模型計算的所述目標文本與所述相似文本之間的相似度;
在獲取到所述目標文本與所述相似文本之間的相似度時,匹配與所述目標文本相似度最高的相似文本。
可選的,所述在接收到目標文本和相似文本時,讀取所述目標文本和所述相似文本中的字詞粒度,包括:
在接收到目標文本和相似文本時,獲取預置知識庫;
當獲取到所述預置知識庫時,分解所述目標文本和所述相似文本;
在分解所述目標文本和所述相似文本時,讀取所述目標文本和所述相似文本中的字詞粒度。
可選的,所述根據讀取到的所述目標文本的字詞粒度和所述相似文本的字詞粒度,獲取所述目標文本的向量表征信息和所述相似文本的向量表征信息,包括:
在讀取到所述目標文本的字詞粒度和所述相似文本的字詞粒度時,調用預置第一神經網絡模型和預置第二神經網絡模型;
根據所述預置第一神經網絡模型,獲取所述目標文本的字詞向量表征信息和所述相似文本的字詞向量表征信息;
根據所述預置第二神經網絡模型,獲取所述目標文本的向量表征信息和所述相似文本的向量表征信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910521519.7/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





