[發明專利]句子語義匹配方法、系統、存儲介質和電子設備在審
| 申請號: | 202110051094.5 | 申請日: | 2021-01-14 |
| 公開(公告)號: | CN112906398A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 張琨;吳樂;汪萌 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06K9/62 |
| 代理公司: | 北京久誠知識產權代理事務所(特殊普通合伙) 11542 | 代理人: | 余罡 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 句子 語義 匹配 方法 系統 存儲 介質 電子設備 | ||
本發明提供一種句子語義匹配方法、系統、存儲介質和電子設備,涉及句子語義匹配技術領域。本發明包括預處理待分析句子對,獲取待分析句子對的向量表示;將所述向量表示輸入預先訓練的語義關系模型,獲取待分析句子對語義匹配關系的概率;將所述概率作為待分析句子對語義關系的預測結果。基于對比學習的句子語義匹配方法,不僅通過分析輸入句子的文本信息建模句子之間的語義關系;同時,通過對比屬于同一標簽和屬于不同標簽的句子對之間的關系(即關系的關系),從而挖掘出句子對中與標簽相關聯的不變的特征,通過對這些特征的充分利用,實現了更為準確的句子語義表示以及句子語義關系的預測。
技術領域
本發明涉及句子語義匹配技術領域,具體涉及一種句子語義匹配方法、系統、存儲介質和電子設備。
背景技術
句子語義匹配,即識別兩個句子之間的語義關系,是自然語言處理的基礎任務之一,在很多的自然語言處理任務中都有著重要體現。
目前,句子語義匹配技術主要包括兩種:第一種為基于句子文本,主要形式為通過不同類型的神經網絡結構編碼句子語義以及進行語義匹配的度量。第二種為基于句子文本和標簽編碼,主要形式為不僅對句子文本進行處理,同時通過不同的方法編碼整個標簽集合,通過顯式分析輸入句子和標簽之間的關系進行最終的語義關系分類。例如輸入句子和標簽聯合建模,利用便簽的編碼影響整個句子的編碼,從而保證生成的句子語義表示向量與標簽的編碼在同一空間,最終保證了更好的分類;再如多任務學習方法中通過將每個任務的標簽都映射為一個向量表示,在訓練了幾個相關任務之后,針對新的任務,能夠直接使用之前得到的結果。
但是,上述兩種句子語義匹配技術均沒有充分利用輸入句子對的標簽信息,無法準確預測句子語義表示。
發明內容
(一)解決的技術問題
針對現有技術的不足,本發明提供了一種句子語義匹配方法、系統、存儲介質和電子設備,解決了現有句子語義匹配技術無法準確預測句子語義表示的技術問題。
(二)技術方案
為實現以上目的,本發明通過以下技術方案予以實現:
一種句子語義匹配方法,包括:
S1、預處理待分析句子對,獲取待分析句子對的向量表示;
S2、將所述向量表示輸入預先訓練的語義關系模型,獲取待分析句子對語義匹配關系的概率;
S3、將所述概率作為待分析句子對語義關系的預測結果。
優選的,所述步驟S2具體包括:
S21、將所述向量表示輸入預先訓練的語義關系模型,獲取待分析句子對的全局語義向量表示和局部語義向量表示;
S22、拼合所述全局語義向量表示和局部語義向量表示,獲取待分析句子對的語義關系向量表示;
S23、根據所述語義關系向量表示,采用深度學習方法,獲取待分析句子對語義匹配關系的概率。
優選的,所述語義關系模型的構建包括:
預處理多個句子對,獲取所述多個句子對相應的向量表示;
根據所述向量表示,獲取所述多個句子對的全局語義向量表示和局部語義向量表示;
拼合每個句子對的全局語義向量表示和局部語義向量表示,獲取對應的語義關系向量表示;
根據任意單個句子對的語義關系向量表示,采用深度學習方法,獲取該單個句子對語義匹配關系的概率;
根據任意兩個句子對的語義關系向量表示,分析該兩個句子對的關系;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110051094.5/2.html,轉載請聲明來源鉆瓜專利網。





