[發(fā)明專利]文本匹配方法、裝置、設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110669568.2 | 申請日: | 2021-06-16 |
| 公開(公告)號: | CN113297354A | 公開(公告)日: | 2021-08-24 |
| 發(fā)明(設(shè)計)人: | 周楠楠;湯耀華;楊海軍;徐倩 | 申請(專利權(quán))人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 11205 | 代理人: | 張娜;臧建明 |
| 地址: | 518027 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 匹配 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本申請公開了一種文本匹配方法、裝置、設(shè)備及存儲介質(zhì),所述方法包括:在進行文本匹配時,先將待匹配文本輸入至預(yù)訓(xùn)練模型中,得到待匹配文本對應(yīng)的第一向量表示,并根據(jù)待匹配文本中詞匯之間的依存關(guān)系,確定的待匹配文本對應(yīng)的第二向量表示,再結(jié)合第一向量和第二向量表示共同確定待匹配文本對應(yīng)的目標向量表示,充分考慮到了待匹配文本中詞匯之間的依存關(guān)系,提高了用于描述待匹配文本的向量表示的準確度;這樣再根據(jù)準確度較高的目標向量表示,確定待匹配文本的匹配結(jié)果,提高了文本匹配結(jié)果的準確度。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種文本匹配方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
文本匹配在越來越多的領(lǐng)域內(nèi)都得到的廣泛的應(yīng)用,例如,智能問答領(lǐng)域或者文本領(lǐng)域。
現(xiàn)有技術(shù)中,在進行文本匹配時,先在待匹配文本的首位增加CLS標志位,并將增加后的待匹配文本輸入至預(yù)訓(xùn)練模型,并將預(yù)訓(xùn)練模型輸出結(jié)果中最后一層CLS標志位的向量,確定為用于描述該待匹配文本的目標向量,再計算該目標向量與預(yù)先存儲的文本對應(yīng)的向量之間的相似度,從而根據(jù)相似度確定該待匹配文本與數(shù)據(jù)庫中的文本是否匹配。
但是,采用現(xiàn)有的匹配方法,將預(yù)訓(xùn)練模型輸出結(jié)果中最后一層CLS標志位的向量,確定為用于描述該待匹配文本的目標向量,會導(dǎo)致文本匹配的準確度較低。
發(fā)明內(nèi)容
本申請的主要目的在于提供一種文本匹配方法、裝置、設(shè)備及存儲介質(zhì),旨在提高文本匹配的準確度。
為實現(xiàn)上述目的,本申請?zhí)峁┝艘环N文本匹配方法,所述文本匹配方法包括:
獲取待匹配文本。
將所述待匹配文本輸入至預(yù)訓(xùn)練模型中,得到所述待匹配文本對應(yīng)的第一向量表示,并根據(jù)所述待匹配文本中詞匯之間的依存關(guān)系,確定所述待匹配文本對應(yīng)的第二向量表示。
根據(jù)所述第一向量表示和所述第二向量表示,確定所述待匹配文本對應(yīng)的目標向量表示。
根據(jù)所述目標向量表示,確定所述待匹配文本的匹配結(jié)果。
在一種可能的實現(xiàn)方式中,所述根據(jù)所述待匹配文本中詞匯之間的依存關(guān)系,確定所述待匹配文本對應(yīng)的第二向量表示,包括:
將所述待匹配文本輸入至預(yù)先訓(xùn)練的依存句法分析模型中,得到所述待匹配文本中詞匯之間的依存關(guān)系。
根據(jù)所述待匹配文本中詞匯之間的依存關(guān)系,確定所述待匹配文本中的至少一個核心詞匯。
根據(jù)所述至少一個核心詞匯中,各核心詞匯對應(yīng)的向量表示,確定所述第二向量表示。
在一種可能的實現(xiàn)方式中,所述核心詞匯的數(shù)量為至少兩個,所述根據(jù)所述至少一個核心詞匯中,各核心詞匯對應(yīng)的向量表示,確定所述第二向量表示,包括:
對所述各核心詞匯對應(yīng)的向量表示進行加權(quán)平均;將加權(quán)平均結(jié)果確定為所述第二向量表示。
在一種可能的實現(xiàn)方式中,所述根據(jù)所述第一向量表示和所述第二向量表示,確定所述待匹配文本對應(yīng)的目標向量表示,包括:
對所述第一向量表示和所述第二向量表示進行拼接處理,得到拼接處理后的向量表示。
將所述拼接處理后的向量表示,確定為所述目標向量表示。
在一種可能的實現(xiàn)方式中,所述將所述待匹配文本輸入至預(yù)訓(xùn)練模型中,得到所述待匹配文本對應(yīng)的第一向量表示,包括:
將所述待匹配文本輸入至所述預(yù)訓(xùn)練模型中,得到所述待匹配文本對應(yīng)的輸出結(jié)果。
對所述輸出結(jié)果中最后兩層的向量進行加權(quán)平均,得到所述第一向量表示。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳前海微眾銀行股份有限公司,未經(jīng)深圳前海微眾銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110669568.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





