[發(fā)明專利]基于查詢匹配的文章排序方法、裝置、電子設(shè)備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202310431169.1 | 申請日: | 2023-04-13 |
| 公開(公告)號: | CN116431798A | 公開(公告)日: | 2023-07-14 |
| 發(fā)明(設(shè)計(jì))人: | 譙軼軒;姜鵬 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/338;G06F16/332;G06F16/9535;G06F16/9538;G06F16/903;G06F40/166 |
| 代理公司: | 深圳市沃德知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 查詢 匹配 文章 排序 方法 裝置 電子設(shè)備 介質(zhì) | ||
1.一種基于查詢匹配的文章排序方法,其特征在于,所述方法包括:
獲取查詢文本序列及所述查詢文本序列對應(yīng)的多篇待查詢文章,并將多篇所述待查詢文章組合為文章文本序列;
將所述查詢文本序列中的多個(gè)查詢字符與預(yù)設(shè)的多個(gè)特殊字符進(jìn)行第一拼接處理,得到拼接查詢序列,并對所述文章文本序列進(jìn)行第二拼接處理,得到拼接文章序列;
利用預(yù)設(shè)雙向表征模型分別對所述拼接查詢序列和所述拼接文章序列進(jìn)行編碼處理,得到查詢編碼向量及文章編碼向量,并對所述查詢編碼向量和所述文章編碼向量進(jìn)行范數(shù)標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)查詢向量和標(biāo)準(zhǔn)文章向量;
根據(jù)預(yù)設(shè)延遲匹配計(jì)算公式計(jì)算所述標(biāo)準(zhǔn)查詢向量和所述標(biāo)準(zhǔn)文章向量之間的匹配相似值,并根據(jù)所述匹配相似值對多篇所述待查詢文章進(jìn)行排序,得到文章排序結(jié)果。
2.如權(quán)利要求1所述的基于查詢匹配的文章排序方法,其特征在于,所述將所述查詢文本序列中的多個(gè)查詢字符與預(yù)設(shè)特殊字符進(jìn)行第一拼接處理,得到拼接查詢序列,包括:
將所述查詢文本序列中的多個(gè)查詢字符進(jìn)行順序排列,并在順序排列后的多個(gè)查詢字符的開頭添加多個(gè)所述特殊字符中的開頭標(biāo)識(shí)字符,得到初始標(biāo)識(shí)序列;
在所述初始標(biāo)識(shí)序列的后面添加預(yù)設(shè)個(gè)數(shù)的特殊字符中的掩碼字符,得到拼接查詢序列。
3.如權(quán)利要求1所述的基于查詢匹配的文章排序方法,其特征在于,所述利用預(yù)設(shè)雙向表征模型對所述拼接查詢序列進(jìn)行編碼處理,得到查詢編碼向量,包括:
對所述拼接查詢序列進(jìn)行向量化處理,得到嵌入向量集;
利用所述雙向表征模型中的編碼層對所述嵌入向量集進(jìn)行編碼處理,得到查詢編碼向量。
4.如權(quán)利要求1所述的基于查詢匹配的文章排序方法,其特征在于,所述對所述查詢編碼向量進(jìn)行范數(shù)標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)查詢向量,包括:
根據(jù)預(yù)設(shè)范數(shù)定義構(gòu)建范數(shù)公式,并根據(jù)所述范數(shù)公式計(jì)算得到參考范數(shù);
將所述查詢編碼向量中的每個(gè)元素除以所述參考范數(shù),得到標(biāo)準(zhǔn)查詢向量。
5.如權(quán)利要求1所述的基于查詢匹配的文章排序方法,其特征在于,所述根據(jù)預(yù)設(shè)延遲匹配計(jì)算公式計(jì)算所述標(biāo)準(zhǔn)查詢向量和所述標(biāo)準(zhǔn)文章向量之間的匹配相似值,包括:
所述預(yù)設(shè)延遲匹配計(jì)算公式為:
其中,Sq,d為所述匹配相似值,Eqi表示第i個(gè)標(biāo)準(zhǔn)查詢向量,Edi表示第i個(gè)標(biāo)準(zhǔn)文章向量,T表示轉(zhuǎn)置矩陣,|q|表示所述標(biāo)準(zhǔn)查詢向量的模。
6.如權(quán)利要求1所述的基于查詢匹配的文章排序方法,其特征在于,所述根據(jù)所述匹配相似值對多篇所述待查詢文章進(jìn)行排序,得到文章排序結(jié)果,包括:
遍歷所述待查詢文章中任意選取的目標(biāo)文章的每個(gè)向量并進(jìn)行延遲匹配計(jì)算,得到多個(gè)匹配相似值;
選取多個(gè)所述匹配相似值中的最大值作為所述查詢文本序列對應(yīng)的匹配分?jǐn)?shù);
根據(jù)預(yù)設(shè)順序遍歷所述查詢文本序列中的每一個(gè)查詢文本字符并將所述匹配分?jǐn)?shù)作為目標(biāo)文章的最終匹配得分;
對多篇所述待查詢文章執(zhí)行最終匹配得分計(jì)算過程,得到多個(gè)最終匹配得分,根據(jù)所述最終匹配得分對多篇所述待查詢文章進(jìn)行排序處理,得到文章排序結(jié)果。
7.如權(quán)利要求1所述的基于查詢匹配的文章排序方法,其特征在于,所述對所述文章文本序列進(jìn)行第二拼接處理,得到拼接文章序列,包括:
對預(yù)獲取的總結(jié)字符和文章開始字符進(jìn)行連接處理,得到連接字符;
將所述連接字符添加至所述文章文本序列的開頭,得到拼接文章序列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310431169.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 帶有前處理和后處理的數(shù)據(jù)庫復(fù)合查詢系統(tǒng)及方法
- 數(shù)據(jù)庫查詢的方法和系統(tǒng)
- 查詢系統(tǒng)、查詢終端以及查詢方法
- 交易信息查詢方法、查詢裝置及查詢系統(tǒng)
- 數(shù)據(jù)查詢與結(jié)果生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在RDF數(shù)據(jù)集上進(jìn)行OPTIONAL查詢的方法及存儲(chǔ)介質(zhì)
- 一種多表關(guān)聯(lián)查詢方法、裝置及設(shè)備
- 一種基于Impala的查詢方法和裝置
- 從查詢生成子查詢
- 一種基于通用查詢語言的查詢方法及查詢系統(tǒng)





