[發明專利]一種面向搜索系統的查詢表達式自動化生成裝置在審
| 申請號: | 202011300521.0 | 申請日: | 2020-11-18 |
| 公開(公告)號: | CN114528465A | 公開(公告)日: | 2022-05-24 |
| 發明(設計)人: | 楊亞強;李生;黃恒;張靖元;余鵬 | 申請(專利權)人: | 小紅書科技有限公司 |
| 主分類號: | G06F16/9532 | 分類號: | G06F16/9532;G06F40/289;G06F40/295;G06K9/62;G06N20/00;G06F16/9538 |
| 代理公司: | 上海市海華永泰律師事務所 31302 | 代理人: | 王波 |
| 地址: | 200082 上海市楊浦區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 搜索 系統 查詢 表達式 自動化 生成 裝置 | ||
1.一種面向搜索系統的查詢表達式自動化生成裝置,其特征在于,包括查詢詞樹,所述的查詢詞樹通過下述步驟構建:
選取訓練數據集的步驟;
對查詢詞進行預處理的步驟;
確定查詢域的步驟;
生成查詢條件的步驟;
根據所述查詢條件,所述查詢域和所述信息源的信息構建查詢詞樹的步驟。
2.權利要求1的面向搜索系統的查詢表達式自動化生成裝置,其特征在于,所述訓練數據集中,使用戶點擊的數據作為正樣本、所述信息源中的隨機采樣數據作為負樣本。
3.權利要求1的面向搜索系統的查詢表達式自動化生成裝置,其特征在于,所述對查詢詞進行預處理的步驟包括對查詢詞的分詞和/或分類。
4.權利要求3的面向搜索系統的查詢表達式自動化生成裝置,其特征在于,所述對查詢詞的分類步驟中,分類可以包括至少一個級別。
5.權利要求1的面向搜索系統的查詢表達式自動化生成裝置,其特征在于,所述確定查詢域的步驟還包括對查詢域分配不同的優先級。
6.權利要求1的面向搜索系統的查詢表達式自動化生成裝置,其特征在于,所述生成查詢條件的步驟中,所述查詢條件由所述查詢詞的識別結果與所述查詢域組合而成。
7.權利要求1的面向搜索系統的查詢表達式自動化生成裝置,其特征在于,所述根據所述查詢條件,所述查詢域和所述信息源的信息構建查詢詞樹的步驟中,將所述查詢條件作為樹的節點,根據所述查詢條件對所述信息源的信息進行分組,確定節點的左右孩子。
8.權利要求1的面向搜索系統的查詢表達式自動化生成裝置,其特征在于,還包括根據所述查詢詞樹生成查詢表達式的步驟。
9.一種面向搜索系統的查詢表達式自動化生成方法,其特征在于,包括構建查詢詞樹的步驟,和生成查詢表達式步驟;所述構建查詢詞樹的步驟包括:
選取訓練數據集的步驟;
對查詢詞進行預處理的步驟;
確定查詢域的步驟;
生成查詢條件的步驟;
根據所述查詢條件,所述查詢域和所述信息源的信息構建查詢詞樹的步驟。
10.權利要求9所述的面向搜索系統的查詢表達式自動化生成方法,其特征在于,所述生成查詢表達式步驟通過遍歷所述查詢詞樹生成所述查詢表達式。
11.權利要求9的面向搜索系統的查詢表達式自動化生成方法,其特征在于,所述訓練數據集中,使用戶點擊的數據作為正樣本、所述信息源中的隨機采樣數據作為負樣本。
12.權利要求9的面向搜索系統的查詢表達式自動化生成方法,其特征在于,所述對查詢詞進行預處理的步驟包括對查詢詞的分詞和/或分類。
13.權利要求12的面向搜索系統的查詢表達式自動化生成方法,其特征在于,所述對查詢詞的分類步驟中,分類可以包括至少一個級別。
14.權利要求9的面向搜索系統的查詢表達式自動化生成方法,其特征在于,所述確定查詢域的步驟還包括對查詢域分配不同的優先級。
15.權利要求9的面向搜索系統的查詢表達式自動化生成方法,其特征在于,所述生成查詢條件的步驟中,所述查詢條件由所述查詢詞的識別結果與所述查詢域組合而成。
16.權利要求9的面向搜索系統的查詢表達式自動化生成方法,其特征在于,所述根據所述查詢條件,所述查詢域和所述信息源的信息構建查詢詞樹的步驟中,將所述查詢條件作為樹的節點,根據所述查詢條件對所述信息源的信息進行分組,確定節點的左右孩子。
17.權利要求9的面向搜索系統的查詢表達式自動化生成方法,其特征在于,還包括根據所述查詢詞樹生成查詢表達式的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于小紅書科技有限公司,未經小紅書科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011300521.0/1.html,轉載請聲明來源鉆瓜專利網。





