[發明專利]基于查詢匹配的文章排序方法、裝置、電子設備及介質在審
| 申請號: | 202310431169.1 | 申請日: | 2023-04-13 |
| 公開(公告)號: | CN116431798A | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 譙軼軒;姜鵬 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/338;G06F16/332;G06F16/9535;G06F16/9538;G06F16/903;G06F40/166 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 查詢 匹配 文章 排序 方法 裝置 電子設備 介質 | ||
本發明涉及數字醫療領域的自然語言處理技術,揭露一種基于查詢匹配的文章排序方法,包括:分別對查詢文本序列和文章文本序列進行第一拼接處理和第二拼接處理,得到拼接查詢序列和拼接文章序列,對拼接查詢序列和拼接文章序列進行編碼,得到查詢編碼向量及文章編碼向量,對查詢編碼向量和文章編碼向量進行范數標準化,得到標準查詢向量和標準文章向量,計算標準查詢向量和標準文章向量之間的匹配相似值,根據匹配相似值對多篇待查詢文章進行排序,得到文章排序結果。此外,本發明還涉及區塊鏈技術,匹配相似值可存儲于區塊鏈的節點。本發明還提出一種基于查詢匹配的文章排序裝置、電子設備以及存儲介質。本發明可以提高文章排序的效率。
技術領域
本發明涉及人工智能領域,尤其涉及一種基于查詢匹配的文章排序方法、裝置、電子設備及存儲介質。
背景技術
隨著互聯網技術的發展,各類不同的社交平臺涌現,而在社交平臺上會出現百萬級甚至千萬級的文章,社交平臺的作用之一就是要將文章準確推送給用戶,其中最關鍵的部分就是要對大量的文章進行排序,根據得到的文章排序結果進行推送。
現有的文章排序方法通常是通過交互模式實現,在交互模式中通過模型才能知道查詢文本和待查詢文章的匹配程度,無法提前計算文章的編碼向量。但真實場景中文章的數量是巨大的,一般是百萬甚至是千萬級別,每個文章都和給定的查詢重頭計算匹配程度,會導致無法接受的時間延遲,從而帶來不佳的用戶體驗,進而最終影響文章排序的效率。因此亟待提出一種效率更高的文章排序方法。
發明內容
本發明提供一種基于查詢匹配的文章排序方法、裝置、電子設備及存儲介質,其主要目的在于提高文章排序的效率。
為實現上述目的,本發明提供的一種基于查詢匹配的文章排序方法,包括:
獲取查詢文本序列及所述查詢文本序列對應的多篇待查詢文章,并將多篇所述待查詢文章組合為文章文本序列;
將所述查詢文本序列中的多個查詢字符與預設的多個特殊字符進行第一拼接處理,得到拼接查詢序列,并對所述文章文本序列進行第二拼接處理,得到拼接文章序列;
利用預設雙向表征模型分別對所述拼接查詢序列和所述拼接文章序列進行編碼處理,得到查詢編碼向量及文章編碼向量,并對所述查詢編碼向量和所述文章編碼向量進行范數標準化處理,得到標準查詢向量和標準文章向量;
根據預設延遲匹配計算公式計算所述標準查詢向量和所述標準文章向量之間的匹配相似值,并根據所述匹配相似值對多篇所述待查詢文章進行排序,得到文章排序結果。
可選地,所述將所述查詢文本序列中的多個查詢字符與預設特殊字符進行第一拼接處理,得到拼接查詢序列,包括:
將所述查詢文本序列中的多個查詢字符進行順序排列,并在順序排列后的多個查詢字符的開頭添加多個所述特殊字符中的開頭標識字符,得到初始標識序列;
在所述初始標識序列的后面添加預設個數的特殊字符中的掩碼字符,得到拼接查詢序列。
可選地,所述利用預設雙向表征模型對所述拼接查詢序列進行編碼處理,得到查詢編碼向量,包括:
對所述拼接查詢序列進行向量化處理,得到嵌入向量集;
利用所述雙向表征模型中的編碼層對所述嵌入向量集進行編碼處理,得到查詢編碼向量。
可選地,所述對所述查詢編碼向量進行范數標準化處理,得到標準查詢向量,包括:
根據預設范數定義構建范數公式,并根據所述范數公式計算得到參考范數;
將所述查詢編碼向量中的每個元素除以所述參考范數,得到標準查詢向量。
可選地,所述根據預設延遲匹配計算公式計算所述標準查詢向量和所述標準文章向量之間的匹配相似值,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310431169.1/2.html,轉載請聲明來源鉆瓜專利網。





