[發明專利]搜索排序方法、裝置、電子設備以及計算機可讀存儲介質在審
| 申請號: | 202011620480.3 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112749238A | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 范成 | 申請(專利權)人: | 北京金堤征信服務有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F16/9535;G06F16/9538;G06K9/62 |
| 代理公司: | 北京康盛知識產權代理有限公司 11331 | 代理人: | 董娣 |
| 地址: | 100086 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 排序 方法 裝置 電子設備 以及 計算機 可讀 存儲 介質 | ||
1.一種搜索排序方法,其特征在于,所述方法包括:
響應于輸入的數據搜索請求,召回與所述數據搜索請求對應的多個搜索結果數據,各個搜索結果數據包括多維度數據;
根據多維度數據的數據特征類別,確定各搜索結果數據的多維度數據對應的數據特征向量值;
基于所述各搜索結果的多維度數據的數據特征向量計算所述多個搜素結果數據的搜索概率;
根據所述多個搜素結果數據的搜索概率,對所述多個搜索結果數據進行排序輸出。
2.如權利要求1所述的方法,其特征在于,所述根據多維度數據的數據特征類別,確定各搜索結果數據的多維度數據對應的數據特征向量,包括以下任意一項或多項:
所述數據特征類別包括數值特征,按照預設特征值映射關系確定數據特征類別為數值特征的維度數據的特征向量值;
所述數據特征類別包括結構化文本特征,獲取所述數據搜索請求中的搜索詞,計算所述搜索詞與具有結構化文本特征的多維度數據的第一數據匹配度,根據所述第一數據匹配度確定數據特征類別為結構化文本特征的維度數據的特征向量值;
所述數據特征類別包括非結構化文本特征,將所述非結構化文本特征進行結構化處理;獲取所述數據搜索請求中的搜索詞,計算所述搜索詞與進行結構化處理的多維度數據的第二數據匹配度,根據所述第二數據匹配度確定數據特征類別為非結構化文本特征的維度數據的特征向量值。
3.如權利要求2所述的方法,其特征在于,將所述非結構化文本特征進行結構化處理,包括:
抽取所述非結構化文本中的實體數據;
根據情感判斷算法對所述實體數據進行過濾;
根據預設表達規則對過濾后的實體數據進行規則匹配,并生成結構化數據。
4.如權利要求1所述的方法,其特征在于,所述搜索排序模型包括多層感知器,每層感知器中包括多個處理節點,基于所述各搜索結果的多維度數據的數據特征向量計算所述多個搜素結果數據的搜索概率,包括:
將所述搜索結果集合輸入預先訓練的搜索排序模型;
對輸入的所述搜索結果集合中各特征向量值進行處理,輸出搜索概率值,根據所述搜索概率值確定所述多個搜索結果數據的搜索概率;其中,每層感知器根據以下方式進行處理:
f(x)=f(w*x+b)
其中,x和b的數據維度為所在層感知器的輸入向量維度,第一層感知器的向量維度為所輸入向量的維度,最后一層感知器的向量維度為預設值,f為sigmoid函數。
5.如權利要求1所述的方法,其特征在于,基于所述各搜索結果的多維度數據的數據特征向量計算所述多個搜素結果數據的搜索概率,包括:
將數據搜索請求與各搜索結果數據、多維度數據的特征向量值建立關聯關系,生成具有所述關聯關系的搜索結果集合;
將所述搜索結果集合輸入預先訓練的搜索排序模型,并計算所述搜索結果集合中各特征向量值擬合的排序評分值;
根據所述排序評分值確定各個搜素結果數據的搜索概率。
6.如權利要求1或5所述的方法,其特征在于,所述方法還包括:
獲取所述數據搜索請求的歷史搜索記錄集合,所述歷史搜索記錄集合包括多個歷史搜索結果數據以及各歷史搜索結果數據的點擊頻次;
所述基于所述各搜索結果的多維度數據的數據特征向量計算所述多個搜素結果數據的搜索概率,包括:
結合所述各歷史搜索結果數據的點擊頻次確定各個搜素結果數據的搜索概率。
7.如權利要求6所述的方法,其特征在于,結合所述各歷史搜索結果的點擊頻次確定各個搜素結果數據的搜索概率,包括:
從根據點擊頻次確定的搜索概率小于預設概率指標的搜素結果數據中進行負采樣,獲得負采樣數據;
根據所述負采樣數據的原始排列順序計算所述負采樣數據的概率偏差;
根據所述概率偏差調整對應搜素結果數據的搜索概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金堤征信服務有限公司,未經北京金堤征信服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011620480.3/1.html,轉載請聲明來源鉆瓜專利網。





