[發明專利]生成用于搜索內容的分類模型方法、裝置和數據處理系統有效
| 申請號: | 201611090113.0 | 申請日: | 2016-11-30 |
| 公開(公告)號: | CN107301195B | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 張偉德;王俊晴;劉博聰;朱偉鋮 | 申請(專利權)人: | 百度(美國)有限責任公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06K9/62 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;王艷春 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 生成 用于 搜索 內容 分類 模型 方法 裝置 數據處理系統 | ||
1.一種生成用于搜索內容的分類模型的計算機實施方法,所述方法包括:
對于多個預定類別中的每一個,
接收一組預定查詢,所述預定查詢中的每一個與所述預定類別相關聯;
對于所述預定查詢中的每一個:
使用與所述預定類別對應的注釋詞典來注釋所述預定查詢,以及
基于所述預定查詢的注釋,從所述預定查詢提取一個或多個特征;
基于所述預定查詢以及與所述預定查詢相關聯的特征來訓練和生成與所述預定類別對應的分類模型,其中利用所述分類模型確定用戶屬于所述預定類別的概率,由此生成多個分類模型,每一個分類模型與所述多個預定類別中的一個對應,
從所述用戶的客戶端裝置接收第一搜索查詢,所述第一搜索查詢具有一個或多個關鍵字;
響應于所述第一搜索查詢,使用多個注釋詞典來注釋所述第一搜索查詢的關鍵字;
從所述第一搜索查詢的所注釋的關鍵字提取特征;以及
由對所提取的特征應用所述多個分類模型來對所述用戶進行分類。
2.如權利要求1所述的方法,其中所述注釋詞典包含與所述預定類別相關聯的一組關鍵字,所述一組關鍵字是從與所述預定類別相關聯的一個或多個預定內容服務器收集的。
3.如權利要求1所述的方法,其中從所述預定查詢提取一個或多個特征包括:從所述預定查詢的一個或多個關鍵字提取一個或多個位置特征,其中每個位置特征指示關鍵字在所述預定查詢內的位置。
4.如權利要求3所述的方法,還包括從所述預定查詢的一個或多個關鍵字提取一個或多個字的N元語法特征。
5.如權利要求4所述的方法,還包括從所述預定查詢的一個或多個關鍵字提取一個或多個注釋特征,其中每個注釋特征指示是否在所述注釋詞典中找到了對應的關鍵字。
6.如權利要求1所述的方法,還包括:
基于所述用戶的分類,在內容數據庫中執行搜索以檢索包含一個或多個內容項目的列表;以及
將所述包含一個或多個內容項目的列表傳送到所述客戶端裝置。
7.一種生成用于搜索內容的分類模型的裝置,包括:
接收裝置,接收一組預定查詢,所述預定查詢中的每一個與預定類別相關聯;
注釋裝置,使用與所述預定類別對應的注釋詞典來注釋所述預定查詢中的每一個;
提取裝置,基于所述預定查詢中每一個的注釋從所述預定查詢中的每一個提取一個或多個特征;
訓練和生成裝置,基于所述預定查詢以及與所述預定查詢相關聯的特征來訓練和生成與所述預定類別對應的分類模型,其中利用所述分類模型確定用戶屬于所述預定類別的概率,由此生成多個分類模型,每一個所述分類模型與多個所述預定類別中的一個對應;
從用戶的客戶端裝置接收第一搜索查詢的裝置,所述第一搜索查詢具有一個或多個關鍵字;
響應于所述第一搜索查詢,使用多個注釋詞典來注釋所述第一搜索查詢的關鍵字的裝置;
從所述第一搜索查詢的所注釋的關鍵字提取特征的裝置;以及
由對所提取的特征應用所述多個分類模型來對所述用戶進行分類的裝置。
8.如權利要求7所述的裝置,其中所述注釋詞典包含與所述預定類別相關聯的一組關鍵字,所述一組關鍵字是從與所述預定類別相關聯的一個或多個預定內容服務器收集的。
9.如權利要求7所述的裝置,其中所述提取裝置包括:從所述預定查詢的一個或多個關鍵字提取一個或多個位置特征的裝置,其中每個位置特征指示關鍵字在所述預定查詢內的位置。
10.如權利要求9所述的裝置,還包括:從所述預定查詢的一個或多個關鍵字提取一個或多個字的N元語法特征的裝置。
11.如權利要求10所述的裝置,還包括:從所述預定查詢的一個或多個關鍵字提取一個或多個注釋特征的裝置,其中每個注釋特征指示是否在所述注釋詞典中找到了對應的關鍵字。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度(美國)有限責任公司,未經百度(美國)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611090113.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:瓦片式柵格地圖的壓縮存儲及發布方法
- 下一篇:一種半主動懸置參數辨識方法
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





