[發明專利]基于信息交互的文本相似度識別方法、裝置、設備及介質在審
| 申請號: | 202110308959.1 | 申請日: | 2021-03-23 |
| 公開(公告)號: | CN112989815A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 吳曉東 | 申請(專利權)人: | 平安國際智慧城市科技股份有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06F40/30;G06F40/126;G06N3/04 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 涂年影 |
| 地址: | 518000 廣東省深圳市前海深港合*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 信息 交互 文本 相似 識別 方法 裝置 設備 介質 | ||
本發明公開了基于信息交互的文本相似度識別方法、裝置、設備及介質,方法包括:分別對第一文本信息及第二文本信息進行轉換得到兩個字符序列并分別從兩個文本信息中提取得到兩個關鍵詞序列,對兩個字符序列進行映射轉換得到字符編碼信息并輸入神經網絡模型得到字符向量,根據字符向量分別獲取兩個關鍵詞序列的關鍵詞向量并輸入自注意力神經網絡得到兩個關鍵詞表征向量,通過相似度識別模型進行識別得到識別結果。本發明屬于語義解析技術領域且還涉及區塊鏈技術,通過向量信息交互得到的字符向量進一步獲取兩個文本信息分別對應的兩個關鍵詞表征向量,基于向量信息的交互進行相似度識別可減少識別過程耗時,并大幅提高相似度識別的準確率。
技術領域
本發明涉及語義解析技術領域,屬于智慧城市中對文本信息進行智能分析以實現基于信息交互進行文本相似度識別的應用場景,尤其涉及一種基于信息交互的文本相似度識別方法、裝置、設備及介質。
背景技術
對文本相似度進行識別主要基于自然語言處理(NLP)技術,可基于自然語言處理(NLP)技術構建語義匹配模型對文本相似度進行識別。然而基于傳統技術方法所構建的語義匹配模型通常是將待匹配的兩個文本分別進行編碼得到兩個文本向量,并計算兩個文本向量之間的余弦相似度或歐氏距離,以對待匹配的兩個文本的相似度進行匹配識別。然而這一傳統技術方法在實際應用過程中需要配置較多參數才能夠獲取較為準確的識別結果,進行文本相似度識別過程中需要執行大量計算分析才能最終得到識別結果,導致識別過程耗時較長而影響了進行文本相似度識別的效率。因此,現有的技術方法中對文本相似度進行識別的過程存在識別效率較低的問題。
發明內容
本發明實施例提供了一種基于信息交互的文本相似度識別方法、裝置、設備及介質,旨在解決現有技術方法中對文本相似度進行識別的過程所存在的識別效率較低的問題。
第一方面,本發明實施例提供了一種基于信息交互的文本相似度識別方法,其包括:
若接收到用戶所輸入的第一文本信息及第二文本信息,將所述第一文本信息及所述第二文本信息分別轉換為對應的第一字符序列及第二字符序列;
根據預置的關鍵詞提取模型分別從所述第一文本信息及所述第二文本信息中提取得到對應的第一關鍵詞序列及第二關鍵詞序列;
根據預置的字符映射信息對所述第一字符序列及所述第二字符序列進行映射轉換得到字符編碼信息;
將所述字符編碼信息輸入預置的神經網絡模型,得到與所述字符編碼信息對應的字符向量;
根據所述字符向量分別獲取與所述第一關鍵詞序列及所述第二關鍵詞序列對應的第一關鍵詞向量及第二關鍵詞向量;
將所述第一關鍵詞向量及所述第二關鍵詞向量分別輸入所述神經網絡模型中的自注意力神經網絡,得到對應的第一關鍵詞表征向量及第二關鍵詞表征向量;
根據預置的相似度識別模型獲取所述第一關鍵詞表征向量與所述第二關鍵詞表征向量的識別結果。
第二方面,本發明實施例提供了一種基于信息交互的文本相似度識別裝置,其包括:
文本信息轉換單元,用于若接收到用戶所輸入的第一文本信息及第二文本信息,將所述第一文本信息及所述第二文本信息分別轉換為對應的第一字符序列及第二字符序列;
關鍵詞序列提取單元,用于根據預置的關鍵詞提取模型分別從所述第一文本信息及所述第二文本信息中提取得到對應的第一關鍵詞序列及第二關鍵詞序列;
字符編碼信息獲取單元,用于根據預置的字符映射信息對所述第一字符序列及所述第二字符序列進行映射轉換得到字符編碼信息;
字符向量獲取單元,用于將所述字符編碼信息輸入預置的神經網絡模型,得到與所述字符編碼信息對應的字符向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安國際智慧城市科技股份有限公司,未經平安國際智慧城市科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110308959.1/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





