[發明專利]一種與移動終端相適應的搜索方法及裝置有效
| 申請號: | 201210520964.X | 申請日: | 2012-12-06 |
| 公開(公告)號: | CN103020208B | 公開(公告)日: | 2019-04-26 |
| 發明(設計)人: | 程剛;魏少俊;張燕靜;蒲鵬;羅高景 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 倪志華 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 移動 終端 相適應 搜索 方法 裝置 | ||
1.一種與移動終端相適應的搜索方法,包括:
預先提取網絡中的web頁面的元信息,并根據所述元信息確定與所述web頁面對應的wap頁面,提取所述對應的wap頁面的文本特征向量以及所述web頁面的文本特征向量,若所述對應的wap頁面的文本特征向量與所述web頁面的文本特征向量之間的相似度大于設定值,建立所述web頁面與所述對應的wap頁面之間的映射關系;
獲取用戶搜索請求;
獲取與所述請求中的關鍵詞匹配的檢索結果項,并根據所述請求確定所述用戶的終端是否為移動終端,如果是,則將所述檢索結果項中與所述映射關系中的記錄匹配的web頁面項轉換為wap頁面項;
將轉換后的檢索結果項返回給用戶。
2.根據權利要求1所述的方法,其特征在于,影響所述wap頁面的文本特征向量的因素包括所述wap頁面中詞語的詞頻和逆文檔頻率,以及,影響所述web頁面的文本特征向量的因素包括所述web頁面中詞語的詞頻和逆文檔頻率。
3.根據權利要求1所述的方法,其特征在于,根據所述請求確定所述用戶的終端是否為移動終端的步驟包括:
確定所述請求中是否存在地理位置標識信息,如果是,則確定所述用戶的終端為移動終端。
4.一種與移動終端相適應的搜索裝置,包括:
預處理單元,用于預先提取網絡中的web頁面的元信息,并根據所述元信息確定與所述web頁面對應的wap頁面,提取所述對應的wap頁面的文本特征向量以及所述web頁面的文本特征向量,若所述對應的wap頁面的文本特征向量與所述web頁面的文本特征向量之間的相似度大于設定值,建立所述web頁面與所述對應的wap頁面之間的映射關系;
接收單元,用于獲取用戶搜索請求;
檢索單元,用于獲取與所述請求中的關鍵詞匹配的檢索結果項;
轉換單元,用于根據所述請求確定所述用戶的終端是否為移動終端,如果是,則將所述檢索結果項中與所述映射關系中的記錄匹配的web頁面項轉換為wap頁面項;
發送單元,用于將轉換后的檢索結果項返回給用戶。
5.根據權利要求4所述的裝置,其特征在于,影響所述wap頁面的文本特征向量的因素包括所述wap頁面中詞語的詞頻和逆文檔頻率,以及,影響所述web頁面的文本特征向量的因素包括所述web頁面中詞語的詞頻和逆文檔頻率。
6.根據權利要求4所述的裝置,其特征在于,所述轉換單元根據所述請求確定所述用戶的終端是否為移動終端的方式包括:
確定所述請求中是否存在地理位置標識信息,如果是,則確定所述用戶的終端為移動終端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210520964.X/1.html,轉載請聲明來源鉆瓜專利網。





