[發(fā)明專利]網(wǎng)絡(luò)信息檢索系統(tǒng)及檢索方法無效
| 申請?zhí)枺?/td> | 201110418140.7 | 申請日: | 2011-12-14 |
| 公開(公告)號: | CN102567473A | 公開(公告)日: | 2012-07-11 |
| 發(fā)明(設(shè)計)人: | 楊宏宇 | 申請(專利權(quán))人: | 鴻富錦精密工業(yè)(深圳)有限公司;鴻海精密工業(yè)股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518109 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)絡(luò) 信息 檢索系統(tǒng) 檢索 方法 | ||
1.一種網(wǎng)絡(luò)信息檢索系統(tǒng),其特征在于,該網(wǎng)絡(luò)信息檢索系統(tǒng)包括:
一輸入確定模塊,用于響應(yīng)用戶的輸入操作,確認(rèn)用戶輸入的搜索關(guān)鍵字;
一檢索模塊,用于根據(jù)該用戶輸入的搜索關(guān)鍵字在網(wǎng)絡(luò)中搜索與該搜索關(guān)鍵字內(nèi)容相匹配的網(wǎng)頁;
一內(nèi)容提取模塊,用于從該檢索模塊檢索到的所有網(wǎng)頁中提取網(wǎng)頁的地址及網(wǎng)頁記載的文字信息和圖片信息;
一去重處理模塊,用于獲取該內(nèi)容提取模塊提取的該些網(wǎng)頁的網(wǎng)址及該些網(wǎng)址對應(yīng)的文字信息和圖片信息,并根據(jù)該提取出的文字信息判斷該些網(wǎng)頁中的內(nèi)容是否引用了源地址,若確定該網(wǎng)頁中的內(nèi)容引用自一源地址,則該去重處理模塊將該引用了該源地址的網(wǎng)頁去除,只保留該源地址對應(yīng)的網(wǎng)頁。
2.如權(quán)利要求1所述的網(wǎng)絡(luò)信息檢索系統(tǒng),其特征在于,該去重處理模塊還用于將該些保留的網(wǎng)頁中的文字信息和圖片信息進(jìn)行比較,并判斷該些保留網(wǎng)頁中的文字信息和圖片信息的相似度是否超過一預(yù)先設(shè)定的閾值,所述的相似度以網(wǎng)頁中文字信息和圖片信息的重復(fù)程度來表征;當(dāng)該些保留的網(wǎng)頁中至少兩個網(wǎng)頁中文字信息和圖片信息的相似度超過該閾值時,則顯示該些網(wǎng)頁中文字內(nèi)容最多的一個網(wǎng)頁或時間最早的一個網(wǎng)頁,將其他與該網(wǎng)頁內(nèi)容相似的網(wǎng)頁去除;直到該些保留的網(wǎng)頁中任何兩個網(wǎng)頁內(nèi)容的相似度都沒有超過該閾值,則確定該些被保留的網(wǎng)頁為最終顯示的網(wǎng)頁。
3.如權(quán)利要求2所述的網(wǎng)絡(luò)信息檢索系統(tǒng),其特征在于,該網(wǎng)絡(luò)信息檢索系統(tǒng)還包括一顯示模塊用于顯示該去重處理模塊確定最終顯示的網(wǎng)頁。
4.如權(quán)利要求3所述的網(wǎng)絡(luò)信息檢索系統(tǒng),其特征在于,該網(wǎng)絡(luò)信息檢索系統(tǒng)為運行于作為客戶終端的電子裝置中。
5.如權(quán)利要求3所述的網(wǎng)絡(luò)信息檢索系統(tǒng),其特征在于,該網(wǎng)絡(luò)信息檢索系統(tǒng)運行于服務(wù)商的服務(wù)器中。
6.如權(quán)利要求1所述的網(wǎng)絡(luò)信息檢索系統(tǒng),其特征在于,該內(nèi)容提取模塊通過預(yù)先構(gòu)建的內(nèi)容解析器將網(wǎng)頁的地址、該網(wǎng)頁中的文字和圖片信息及該些信息引用的源地址提取出來。
7.如權(quán)利要求2所述的網(wǎng)絡(luò)信息檢索系統(tǒng),其特征在于,該去重處理模塊根據(jù)用戶的設(shè)置確定保留和去除網(wǎng)頁的條件。
8.一種網(wǎng)絡(luò)信息檢索方法,應(yīng)用于一網(wǎng)絡(luò)信息檢索系統(tǒng)中,其特征在于,該方法包括如下步驟:
響應(yīng)用戶的輸入操作,確認(rèn)用戶輸入的搜索關(guān)鍵字;
根據(jù)該用戶輸入的搜索關(guān)鍵字在網(wǎng)絡(luò)中搜索與該搜索關(guān)鍵字內(nèi)容相匹配的網(wǎng)頁;
對檢索到的所有網(wǎng)頁的地址及網(wǎng)頁記載的文字信息和圖片信息進(jìn)行提取;
獲取提取的該些網(wǎng)頁的網(wǎng)址及該些網(wǎng)頁記載的文字信息和圖片信息,并根據(jù)該提取出的文字信息判斷該些網(wǎng)頁中的內(nèi)容是否引用了源地址;
當(dāng)該些網(wǎng)頁引用了源地址時,將引用該源地址的網(wǎng)頁去除,只保留該網(wǎng)頁內(nèi)容所引用的源地址對應(yīng)的網(wǎng)頁作為最終顯示的網(wǎng)頁。
9.如權(quán)利要求8所述的網(wǎng)絡(luò)信息檢索方法,其特征在于,該方法還包括步驟:
將該些保留的網(wǎng)頁中的文字信息和圖片信息進(jìn)行比較,并判斷該些保留網(wǎng)頁中的文字和圖片信息的相似度是否超過一預(yù)先設(shè)定的閾值,其中,所述的相似度以網(wǎng)頁中記載的文字信息和圖片信息的重復(fù)程度來表征;
當(dāng)兩個或兩個以上網(wǎng)頁中文字信息和圖片信息的相似度超過該閾值時,控制顯示該些網(wǎng)頁中文字內(nèi)容最多的一個網(wǎng)頁或時間最早的一個網(wǎng)頁,將其他與該網(wǎng)頁內(nèi)容相似的網(wǎng)頁去除。
10.如權(quán)利要求9所述的網(wǎng)絡(luò)信息檢索方法,其特征在于,將確定最終顯示的網(wǎng)頁顯示給用戶。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鴻富錦精密工業(yè)(深圳)有限公司;鴻海精密工業(yè)股份有限公司,未經(jīng)鴻富錦精密工業(yè)(深圳)有限公司;鴻海精密工業(yè)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110418140.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





