[發(fā)明專利]一種基于界面返回的搜索方法和裝置有效
| 申請?zhí)枺?/td> | 201310010321.5 | 申請日: | 2013-01-11 |
| 公開(公告)號: | CN103092945B | 公開(公告)日: | 2019-11-26 |
| 發(fā)明(設(shè)計(jì))人: | 賈晨輝 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/9538;G06F16/954 |
| 代理公司: | 11412 北京鴻德海業(yè)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人: | 袁媛<國際申請>=<國際公布>=<進(jìn)入國 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 界面 返回 搜索 方法 裝置 | ||
1.一種基于界面返回的搜索方法,其特征在于,從預(yù)先獲取的網(wǎng)頁信息中提取網(wǎng)頁片段以及對應(yīng)的描述并存入網(wǎng)頁片段庫,所提取的網(wǎng)頁片段為界面形式的網(wǎng)頁中的不同片段,所提取的網(wǎng)頁片段對應(yīng)的描述為從網(wǎng)頁片段的網(wǎng)頁代碼對應(yīng)的文字信息中所提取的關(guān)鍵詞;該方法包括:
接收到用戶在檢索頁面輸入的查詢詞時(shí),在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段,并在所述檢索頁面返回檢索到的網(wǎng)頁片段。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,從預(yù)先獲取的網(wǎng)頁信息中提取的網(wǎng)頁片段包括:
導(dǎo)航網(wǎng)頁片段、瀏覽性網(wǎng)頁片段或功能性網(wǎng)頁片段。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述導(dǎo)航網(wǎng)頁片段的提取包括:提取同一站點(diǎn)下不同頁面中編碼結(jié)構(gòu)以及內(nèi)容相同的部分作為導(dǎo)航網(wǎng)頁片段;
所述功能性網(wǎng)頁片段的提取包括:根據(jù)網(wǎng)頁源代碼中的交互標(biāo)簽,提取網(wǎng)頁中對應(yīng)的交互片段作為功能性網(wǎng)頁片段;
所述瀏覽性網(wǎng)頁片段的提取包括:根據(jù)網(wǎng)頁的DOM樹的結(jié)構(gòu)以及內(nèi)容,提取網(wǎng)頁中對應(yīng)的瀏覽性網(wǎng)頁片段。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,當(dāng)所述導(dǎo)航網(wǎng)頁片段中有指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項(xiàng)時(shí),在所述網(wǎng)頁片段庫中保存該選項(xiàng)的URL與所述某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的對應(yīng)關(guān)系;
當(dāng)用戶在導(dǎo)航網(wǎng)頁片段中選擇所述指向某功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段的選項(xiàng)時(shí),在所述網(wǎng)頁片段庫中檢索并返回與該選項(xiàng)的URL對應(yīng)的功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段。
5.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,當(dāng)所述功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中有返回某導(dǎo)航網(wǎng)頁片段的選項(xiàng)時(shí),在所述網(wǎng)頁片段庫中保存該選項(xiàng)的URL與所述某導(dǎo)航網(wǎng)頁片段的對應(yīng)關(guān)系;
當(dāng)用戶在功能性網(wǎng)頁片段或者瀏覽性網(wǎng)頁片段中選擇返回某導(dǎo)航網(wǎng)頁片段的選項(xiàng)時(shí),在所述網(wǎng)頁片段庫中檢索并返回與該選項(xiàng)的URL對應(yīng)的導(dǎo)航網(wǎng)頁片段。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,在將提取的網(wǎng)頁片段以及對應(yīng)的描述存入網(wǎng)頁片段庫之后,還包括:
根據(jù)所述網(wǎng)頁片段庫中所保存的網(wǎng)頁片段的描述之間的相似度,對所保存的網(wǎng)頁片段進(jìn)行去重處理。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段具體包括:
從所述網(wǎng)頁片段庫中檢索出一個(gè)或多個(gè)權(quán)重值高于預(yù)設(shè)閾值的網(wǎng)頁片段,其中,描述與所述用戶輸入的查詢詞匹配程度越高的網(wǎng)頁片段的權(quán)重值越高。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述網(wǎng)頁片段的權(quán)重值還結(jié)合網(wǎng)頁片段所屬網(wǎng)頁的實(shí)時(shí)熱度和歷史熱度來獲取。
9.根據(jù)權(quán)利要求1、7或8所述的方法,其特征在于,在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段時(shí),采用與所述用戶輸入的查詢詞的長度所對應(yīng)的檢索策略在所述網(wǎng)頁片段庫中檢索與所述查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述檢索頁面返回檢索到的網(wǎng)頁片段的同時(shí),還返回所述用戶輸入的查詢詞在搜索引擎中的搜索結(jié)果。
11.一種基于界面返回的搜索裝置,其特征在于,該裝置包括:
建庫單元,用于從預(yù)先獲取的網(wǎng)頁信息中提取網(wǎng)頁片段以及對應(yīng)的描述并存入網(wǎng)頁片段庫,所提取的網(wǎng)頁片段為界面形式的網(wǎng)頁中的不同片段,所提取的網(wǎng)頁片段對應(yīng)的描述為從網(wǎng)頁片段的網(wǎng)頁代碼對應(yīng)的文字信息中所提取的關(guān)鍵詞;
檢索單元,用于接收到用戶在檢索頁面輸入的查詢詞時(shí),在所述網(wǎng)頁片段庫中檢索與用戶輸入的查詢詞匹配的描述所對應(yīng)的網(wǎng)頁片段,并在所述檢索頁面返回檢索到的網(wǎng)頁片段。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310010321.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





