[發(fā)明專利]文本匹配方法、裝置、存儲介質(zhì)和程序產(chǎn)品在審
| 申請?zhí)枺?/td> | 202111458767.5 | 申請日: | 2021-12-02 |
| 公開(公告)號: | CN114297338A | 公開(公告)日: | 2022-04-08 |
| 發(fā)明(設(shè)計)人: | 石志林 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/335;G06N3/08 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 熊永強(qiáng);賈允 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 匹配 方法 裝置 存儲 介質(zhì) 程序 產(chǎn)品 | ||
本申請?zhí)峁┝艘环N文本匹配方法、裝置、存儲介質(zhì)和程序產(chǎn)品,涉及人工智能技術(shù)領(lǐng)域,可以應(yīng)用于云技術(shù)、人工智能、智慧交通、輔助駕駛等各種場景,包括:獲取目標(biāo)矩陣結(jié)構(gòu)和待匹配文本的待匹配文本特征;目標(biāo)矩陣結(jié)構(gòu)包括多個具有相同節(jié)點數(shù)的矩陣層,單層矩陣層中包括多個節(jié)點,單個節(jié)點對應(yīng)若干個候選文本;針對目標(biāo)矩陣結(jié)構(gòu)中的各矩陣層,通過目標(biāo)文本匹配模型對待匹配文本特征進(jìn)行概率分布預(yù)測處理,得到各矩陣層對應(yīng)的概率分布結(jié)果;基于概率分布結(jié)果分別對各矩陣層中的節(jié)點進(jìn)行篩選處理,得到待匹配文本特征在各矩陣層中對應(yīng)的目標(biāo)節(jié)點;將目標(biāo)節(jié)點對應(yīng)的候選文本確定為與待匹配文本匹配的目標(biāo)文本。本申請能夠有效提高文本匹配的匹配效率。
技術(shù)領(lǐng)域
本申請涉及人工智能技術(shù)領(lǐng)域,尤其涉及一種文本匹配方法、裝置、存儲介質(zhì)和程序產(chǎn)品。
背景技術(shù)
隨著人工智能技術(shù)的發(fā)展,人工智能技術(shù)被廣泛應(yīng)用于信息推薦、信息檢索、輿論分析和信息挖掘等場景,文本匹配是上述各種場景中最基礎(chǔ)的任務(wù)之一。現(xiàn)有的文本匹配方法通常是先獲取文本間的語義相似度,如向量空間距離或夾角等,然后根據(jù)語義相似度排序確定匹配的文本,或者利用預(yù)訓(xùn)練模型進(jìn)行文本匹配。然而,通過語義相似度計算的方法進(jìn)行文本匹配,表達(dá)能力非常局限,得到的相似度結(jié)果準(zhǔn)確性差,且計算量較大,不適用于大規(guī)模文本匹配;預(yù)訓(xùn)練模型存在參數(shù)量龐大的自限性,導(dǎo)致其預(yù)測性能較差,同樣不適合大規(guī)模文本匹配。因此,需要提供一種改進(jìn)的文本匹配方案,以解決上述問題。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N文本匹配方法、裝置和存儲介質(zhì),可以有效提高文本匹配的準(zhǔn)確率和匹配效率,優(yōu)化后續(xù)任務(wù)的應(yīng)用效果。
一方面,本申請?zhí)峁┝艘环N文本匹配方法,所述方法包括:
獲取目標(biāo)矩陣結(jié)構(gòu)和待匹配文本的待匹配文本特征;其中,所述目標(biāo)矩陣結(jié)構(gòu)包括多個具有相同節(jié)點數(shù)的矩陣層,單層矩陣層中包括多個節(jié)點,單個節(jié)點對應(yīng)若干個候選文本;
針對所述目標(biāo)矩陣結(jié)構(gòu)中的各矩陣層,通過目標(biāo)文本匹配模型對所述待匹配文本特征進(jìn)行概率分布預(yù)測處理,得到所述各矩陣層對應(yīng)的概率分布結(jié)果;所述概率分布結(jié)果表征所述待匹配文本特征針對單個矩陣層中各節(jié)點的概率分布;
基于所述概率分布結(jié)果分別對所述各矩陣層中的節(jié)點進(jìn)行節(jié)點篩選處理,得到所述待匹配文本特征在所述各矩陣層中對應(yīng)的目標(biāo)節(jié)點;
將所述目標(biāo)節(jié)點對應(yīng)的候選文本確定為與所述待匹配文本匹配的目標(biāo)文本;
其中,所述目標(biāo)文本匹配模型是以候選文本作為訓(xùn)練樣本,根據(jù)無監(jiān)督學(xué)習(xí)方法對基于所述目標(biāo)矩陣結(jié)構(gòu)構(gòu)建的初始預(yù)測模型,進(jìn)行針對目標(biāo)矩陣結(jié)構(gòu)的各矩陣層的概率分布預(yù)測和所述候選文本的節(jié)點表示更新的迭代訓(xùn)練得到的。
另一方面提供了一種文本匹配裝置,所述裝置包括:
文本特征獲取模塊:用于獲取目標(biāo)矩陣結(jié)構(gòu)和待匹配文本的待匹配文本特征;其中,所述目標(biāo)矩陣結(jié)構(gòu)包括多個具有相同節(jié)點數(shù)的矩陣層,單層矩陣層中包括多個節(jié)點,單個節(jié)點對應(yīng)若干個候選文本;
概率分布預(yù)測模塊:用于針對所述目標(biāo)矩陣結(jié)構(gòu)中的各矩陣層,通過目標(biāo)文本匹配模型對所述待匹配文本特征進(jìn)行概率分布預(yù)測處理,得到所述各矩陣層對應(yīng)的概率分布結(jié)果;所述概率分布結(jié)果表征所述待匹配文本特征針對單個矩陣層中各節(jié)點的概率分布;
目標(biāo)節(jié)點篩選模塊:用于基于所述概率分布結(jié)果分別對所述各矩陣層中的節(jié)點進(jìn)行節(jié)點篩選處理,得到所述待匹配文本特征在所述各矩陣層中對應(yīng)的目標(biāo)節(jié)點;
目標(biāo)文本確定模塊:用于將所述目標(biāo)節(jié)點對應(yīng)的候選文本確定為與所述待匹配文本匹配的目標(biāo)文本;
其中,所述目標(biāo)文本匹配模型是以候選文本作為訓(xùn)練樣本,根據(jù)無監(jiān)督學(xué)習(xí)方法對基于所述目標(biāo)矩陣結(jié)構(gòu)構(gòu)建的初始預(yù)測模型,進(jìn)行針對目標(biāo)矩陣結(jié)構(gòu)的各矩陣層的概率分布預(yù)測和所述候選文本的節(jié)點表示更新的迭代訓(xùn)練得到的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111458767.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





