[發明專利]一種圖片推薦方法和裝置有效
| 申請號: | 201210009043.7 | 申請日: | 2012-01-12 |
| 公開(公告)號: | CN102609458A | 公開(公告)日: | 2012-07-25 |
| 發明(設計)人: | 路晶 | 申請(專利權)人: | 北京搜狗信息服務有限公司;北京搜狗科技發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖片 推薦 方法 裝置 | ||
1.一種圖片推薦方法,其特征在于,包括:
接收用戶的查詢請求,并搜索得到與該查詢請求對應的目標圖片和與該目標圖片相同或近似的結果圖片;
依據所述結果圖片所在的網頁文本,抽取描述圖片語義特征的關鍵詞,作為該目標圖片的關鍵詞;
在搜索日志中進行關鍵詞的匹配,并將與關鍵詞匹配的相應目標圖片推薦給用戶;所述搜索日志記錄有全網用戶的在線查詢請求對應的目標圖片及相應的關鍵詞。
2.如權利要求1所述的方法,其特征在于,所述依據所述結果圖片所在的網頁文本,抽取描述圖片語義特征的關鍵詞的步驟,包括:
依據對所述網頁文本進行聚類分析的結果,去除所述網頁文本中孤立的網頁文本,得到剩余文本;
抽取所述剩余文本中詞頻最高并具有實際意義的詞或短語,作為描述圖片語義特征的關鍵詞。
3.如權利要求2所述的方法,其特征在于,通過以下步驟抽取所述剩余文本中具有實際意義的詞或短語:
調用預先構造的實體詞庫,在所述剩余文本中的詞或短語與所述實體詞庫中的實體詞相匹配時,保留所述詞或短語;所述實體詞庫存儲有具有實際意義的實體詞。
4.如權利要求2所述的方法,其特征在于,通過以下步驟抽取所述剩余文本中具有實際意義的詞或短語:
依據詞性抽取所述剩余文本中具有實際意義的詞或短語,所述抽取過程包括:
在所述剩余文本中的詞或短語為嘆詞、代詞或語氣助詞中的任一種時,丟棄所述詞或短語。
5.如權利要求2所述的方法,其特征在于,所述依據所述結果圖片所在的網頁文本,抽取描述圖片語義特征的關鍵詞的步驟,還包括:
依據所述關鍵詞與所述剩余文本中其他詞匯的相鄰共現頻率,統計所述剩余文本中與所述關鍵詞相鄰的邊緣詞;將所述邊緣詞與關鍵詞一起作為描述圖片語義特征的關鍵詞。
6.如權利要求1至5中任一項所述的方法,其特征在于,所述方法還包括:
在與關鍵詞匹配的相應各目標圖片中濾除相同或近似的圖片,得到剩余圖片;
所述將與關鍵詞匹配的相應目標圖片推薦給用戶的步驟為,將所述剩余圖片推薦給用戶。
7.如權利要求1至5中任一項所述的方法,其特征在于,所述將與關鍵詞匹配的相應目標圖片推薦給用戶的步驟,包括:
依據所述搜索日志,統計所述與關鍵詞匹配的相應目標圖片對應的在線查詢請求數目;
按照在線查詢請求數目的降序將與關鍵詞匹配的相應目標圖片推薦給用戶。
8.如權利要求1至5中任一項所述的方法,其特征在于,該目標圖片為與該查詢請求對應的查詢策略最匹配的圖片;所述結果圖片為除目標圖片外大于匹配閾值的其他圖片。
9.一種圖片推薦裝置,其特征在于,包括:
圖片搜索模塊,用于接收用戶的查詢請求,并搜索得到與該查詢請求對應的目標圖片和與該目標圖片相同或近似的結果圖片;
關鍵詞抽取模塊,用于依據所述結果圖片所在的網頁文本,抽取描述圖片語義特征的關鍵詞,作為該目標圖片的關鍵詞;
匹配模塊,用于在搜索日志中進行關鍵詞的匹配;所述搜索日志記錄有全網用戶的在線查詢請求對應的目標圖片及相應的關鍵詞;及
圖片推薦模塊,用于將與關鍵詞匹配的相應目標圖片推薦給用戶。
10.如權利要求9所述的裝置,其特征在于,所述關鍵詞抽取模塊包括:
去除子模塊,用于依據對所述網頁文本進行聚類分析的結果,去除所述網頁文本中孤立的網頁文本,得到剩余文本;及
抽取子模塊,用于抽取所述剩余文本中詞頻最高并具有實際意義的詞或短語,作為描述圖片語義特征的關鍵詞。
11.如權利要求10所述的裝置,其特征在于,還包括:
第一實際意義抽取模塊,用于調用預先構造的實體詞庫,在所述剩余文本中的詞或短語與所述實體詞庫中的實體詞相匹配時,保留所述剩余文本中的詞或短語;所述實體詞庫存儲有具有實際意義的實體詞。
12.如權利要求10所述的裝置,其特征在于,還包括:
第二實際意義抽取模塊,用于依據詞性抽取所述剩余文本中具有實際意義的詞或短語,所述抽取過程包括:在所述剩余文本中的詞或短語為嘆詞、代詞或語氣助詞中的任一種時,丟棄所述剩余文本中的詞或短語。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗信息服務有限公司;北京搜狗科技發展有限公司,未經北京搜狗信息服務有限公司;北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210009043.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多孔球狀反應裝置及操作方法
- 下一篇:多軸攪拌樁鉆機





