[發明專利]互聯網站內信息的搜索方法和搜索系統在審
| 申請號: | 201110260130.5 | 申請日: | 2011-09-05 |
| 公開(公告)號: | CN102982034A | 公開(公告)日: | 2013-03-20 |
| 發明(設計)人: | 胡文翠;張耀杰 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 謝安昆;宋志強 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 互聯網 站內 信息 搜索 方法 系統 | ||
技術領域
本發明涉及互聯網信息處理技術領域,尤其涉及一種互聯網站內信息的搜索方法和搜索系統。
背景技術
目前,互聯網站點的搭建方式主要有兩種,一種是自行編寫代碼搭建站點;另一種是利用成形的互聯網站點系統搭建站點。例如,互聯網社區軟件系統就是一種成形的互聯網站點系統,互聯網社區站點的擁有者不需要自行開發一套社區軟件系統,而是直接安裝標準化、產品化的社區軟件系統,然后配置自己的社區配置信息,即可搭建一個互聯網社區站點,網友可以利用各種數據處理設備(如計算機、智能手機、平板電腦等)連接登錄該互聯網社區站點查看或發布信息,并與其它網友進行交流互動。
目前比較流行的互聯網社區軟件系統主要有Discuz!社區軟件系統,已經有超過140萬家互聯網社區站點使用Discuz!社區軟件系統進行搭建,這些互聯網社區站點提供的數據量已超過50億。面對如此大巨量的數據,互聯網社區站點迫切需要提供高效的站內搜索服務。
現有技術中,互聯網站點(包括互聯網社區軟件系統)的站內搜索技術主要有兩種:
現有技術一:通過數據庫自帶的文本檢索實現搜索功能。例如Discuz!社區軟件系統的基礎架構采用的是PHP語言+MySQL數據庫這種比較流行的網絡編程組合實現,因此其社區站內搜索功能主要是通過MySQL數據庫自帶的文本檢索實現。
現有技術一的缺點是:由于數據庫安裝在互聯網站點的本地服務器上,執行搜索操作需要占用本地各種資源,因此總體效率不高、服務性能低,且磁盤空間的占用量大、帶寬消耗大、數據更新速度慢,索引膨脹快,難以穩定支撐大規模數據量的查詢服務。而且,MySQL數據庫檢索只能實現對帖子標題的搜索,且是完全匹配,搜索結果只能按時間排序,無法按結果質量和相關性排序。
現有技術二:通過外部專有的網絡搜索引擎提供對應的搜索服務。目前的專有搜索引擎通常采用網頁抓取程序順著網頁中的超鏈接抓取網頁信息,然后提取網頁信息中的關鍵數據并建立索引,當某個互聯網社區站點發出搜索請求后,該搜索請求會發送給外部搜索引擎,外部搜索引擎會從具有該社區站點信息的索引中搜索出搜索結果,返回給該社區站點進行展示。
現有技術二的缺點是:外部搜索引擎目前都是基于全網網頁抓取方式抓取網頁信息再建索引,因此針對某一社區站點內的信息,所抓取的信息量不大、也比較粗略,而且信息時效性較差,比較遲后,因此通過這種方式進行的互聯網社區站內搜索的精確度不高,時效性差。
發明內容
有鑒于此,本發明提供一種互聯網站內信息的搜索方法和搜索系統,以提高站內信息搜索的搜索效率、精確度以及時效性。
本發明的技術方案是這樣實現的:
一種互聯網站內信息的搜索方法,該方法包括:
搜索引擎獲取互聯網站點的數據,根據獲取的數據建立索引并存入索引數據庫;
搜索引擎接收來自互聯網站點的搜索請求,根據收到的搜索請求從索引數據庫中檢索出對應的搜索結果,并將搜索結果返回給所述互聯網站點進行展示。優選的,所述搜索引擎獲取互聯網站點更新的數據的具體方式為:
在所述搜索引擎收到所述互聯網站點更新數據主動通知后,所述搜索引擎從所述互聯網站點指定存放全量數據及實時更新數據列表地址處獲取所述互聯網站點的站內更新數據;
或者,所述搜索引擎定期從所述互聯網站點指定存放全量數據及實時更新數據列表地址處獲取所述互聯網站點的站內更新數據。
優選的,所述搜索引擎在同步得到互聯網站點的數據之后、建立索引之前,進一步對同步得到的數據進行過濾,過濾掉不符合指定條件的數據,之后只對過濾后的數據建立索引并存入索引數據庫。
優選的,該方法進一步在搜索引擎中存儲檢索權限信息;所述來自互聯網站點的搜索請求中進一步包括用戶信息;所述搜索引擎收到搜索請求后,進一步根據用戶信息和存儲的檢索權限信息識別該用戶的檢索權限,從索引數據庫中符合該用戶權限范圍的內容里檢索出搜索結果,并將該搜索結果返回給所述互聯網站點進行展示。
優選的,所述用戶信息為用戶的登錄信息或用戶的來源信息。
優選的,所述搜索引擎進一步從互聯網站點同步本站內更新的用戶權限信息。
優選的,所述來自互聯網站點的搜索請求中進一步包括用戶信息;所述搜索引擎在檢索出對應的搜索結果之后、返回給所述互聯網站點之前,進一步根據搜索請求中提供的用戶信息對該搜索結果進行排序,將排序后的搜索結果返回給互聯網站點進行展示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110260130.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種輪胎模具夾臺
- 下一篇:一種模擬春夏秋冬自然發酵生產高鹽稀態醬油的方法
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





