[發明專利]搜索信息的處理方法、裝置有效
| 申請號: | 202010993865.8 | 申請日: | 2020-09-21 |
| 公開(公告)號: | CN111931500B | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 鐘輝強;徐思琪;周厚謙;陳亮輝;方軍 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216;G06F40/30;G06F16/35;G06N20/00 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 搜索 信息 處理 方法 裝置 | ||
本申請公開了搜索信息的處理方法、裝置、電子設備及計算機可讀存儲介質,涉及自然語言處理領域、機器學習技術領域、數據處理技術領域、特征分析技術領域和深度學習技術領域。具體實現方案為:獲取目標用戶集合的搜索信息集合后確定搜索關鍵字集合,基于該搜索關鍵字集合進行擴展得到擴展搜索關鍵字集合,然后對該擴展搜索關鍵字集合中的內容進行聚類處理,得到多個類別的分類關鍵字集合,聚合各個類別的分類關鍵字集合的特征信息,得到目標用戶集合的搜索特征信息,然后獲取待訓練目標模型,使用該搜索特征信息訓練所述待訓練目標模型,得到訓練后的目標模型,可以根據目標用戶集合的搜索信息完成對模型的訓練,不依賴標簽數據。
技術領域
本申請涉及自然語言處理技術領域,具體涉及機器學習技術領域、數據處理技術領域、特征分析技術領域和深度學習技術領域,尤其涉及搜索信息的處理方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
當今社會中,為了更好的為用戶提供服務,各行各業都引入了深度學習技術來實現對用戶行為的分析,根據分析結果來描繪用戶畫像,以便于后續確定經營策略來為用戶提供更好的服務。
現有技術中,為實現更加準確的用戶行為分析和用戶畫像描繪,需要采用大量的用戶信息作為訓練素材來對神經網絡或者模型進行訓練,以確保訓練得到的神經網絡或者模型能夠準確的對用戶行為進行分析,得到服務提供商需要的結果。
發明內容
本申請提供了一種搜索信息的處理方法、裝置、電子設備以及存儲介質。
第一方面,本申請的實施例提供了一種搜索信息的處理方法,包括:獲取目標用戶集合的搜索信息集合,基于該搜索信息集合確定搜索關鍵字集合;基于該搜索關鍵字集合和對該搜索關鍵字集合進行擴展后得到的擴展后的搜索關鍵字集合,得到擴展搜索關鍵字集合;對該擴展搜索關鍵字集合中的內容進行聚類處理,得到多個類別的分類關鍵字集合;聚合各個類別的分類關鍵字集合的特征信息,得到該目標用戶集合的搜索特征信息;獲取待訓練目標模型,使用該目標用戶集合的搜索特征信息訓練該待訓練目標模型,得到訓練后的目標模型。
第二方面,本申請的實施例提供了一種搜索信息的裝置,包括:關鍵字集合確定單元,被配置成獲取目標用戶集合的搜索信息集合,基于該搜索信息集合確定搜索關鍵字集合;關鍵字集合擴展單元,被配置成基于該搜索關鍵字集合和對該搜索關鍵字集合進行擴展后得到的擴展后的搜索關鍵字集合,得到擴展搜索關鍵字集合;關鍵字集合聚類單元,被配置成對該擴展搜索關鍵字集合中的內容進行聚類處理,得到多個類別的分類關鍵字集合;特征信息生成單元,被配置成聚合各個類別的分類關鍵字集合的特征信息,得到該目標用戶集合的搜索特征信息;目標模型訓練單元,被配置成獲取待訓練目標模型,使用該目標用戶集合的搜索特征信息訓練該待訓練目標模型,得到訓練后的目標模型。
第三方面,本申請的實施例提供了一種電子設備,包括:至少一個處理器;以及與上述至少一個處理器通信連接的存儲器;其中,該存儲器存儲有可被上述至少一個處理器執行的指令,該指令被上述至少一個處理器執行,以使上述至少一個處理器能夠執行如第一方面中任一實現方式描述的搜索信息的處理方法。
第四方面,本申請的實施例提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,包括:該計算機指令用于使該計算機執行如第一方面中任一實現方式描述的搜索信息的處理方法。
第五方面,本申請實施例提供了一種包括計算機程序的計算機程序產品,該計算機程序在被處理器執行時能夠實現如第一方面中任一實現方式描述的搜索信息的處理方法。
本申請在獲取目標用戶集合的搜索信息集合后確定搜索關鍵字集合,基于該搜索關鍵字集合進行擴展,根據該搜索關鍵字集合和擴展后的內容得到擴展搜索關鍵字集合,然后對該擴展搜索關鍵字集合中的內容進行聚類處理,得到多個類別的分類關鍵字集合,聚合各個類別的分類關鍵字集合的特征信息,得到目標用戶集合的搜索特征信息,然后獲取待訓練目標模型,使用該搜索特征信息訓練所述待訓練目標模型,得到訓練后的目標模型,根據目標用戶集合的搜索信息完成對模型的訓練,不依賴標簽數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010993865.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種枳果茶的制作方法
- 下一篇:一種富氫手部免洗消毒凝膠及其制備方法
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





