[發明專利]確定中心詞的方法及裝置、搜索方法及裝置有效
| 申請號: | 201110369651.4 | 申請日: | 2011-11-18 |
| 公開(公告)號: | CN103123624A | 公開(公告)日: | 2013-05-29 |
| 發明(設計)人: | 談云兵;李連華 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 中心詞 方法 裝置 搜索 | ||
技術領域
本申請涉及信息處理技術領域,尤其涉及一種確定中心詞的方法及裝置、搜索方法及裝置。
背景技術
隨著互聯網技術的不斷發展,越來越多的信息資源選擇網絡作為傳播的載體。為了使用戶能夠在海量的互聯網信息中獲取所需要的信息,大多數網站都提供搜索功能,用戶需要搜索某信息時,可以在網站中輸入搜索關鍵詞,該網站查找與該搜索關鍵詞相關的信息,然后提供給用戶。但是,當用戶輸入的搜索關鍵詞太長時,網站就可能搜索不到與該搜索關鍵詞相關的信息,用戶就無法獲取到所需要的信息。
針對上述問題,現有技術提出,網站在為用戶查找信息時,先從用戶輸入的搜索關鍵詞中提取出至少一個中心詞,然后查找與提取出的中心詞相關的信息,將查找到的信息提供給用戶。這樣,即使用戶輸入的搜索關鍵詞過長,網站也能夠根據提取出的中心詞在海量的信息中搜索到相關信息。
如圖1所示,其為現有技術中從搜索關鍵詞中提取中心詞的方法流程示意圖,具體處理流程如下:
步驟11,當用戶需要在網站中搜索某信息時,在該網站中輸入一個搜索關鍵詞,然后確認搜索,該網站就獲得了用戶輸入的搜索關鍵詞。
步驟12,網站將該搜索關鍵詞劃分為各關鍵詞單元。
其中,網站可以基于統計的分詞算法,使用語料庫來劃分關鍵詞單元。例如,用戶輸入的搜索關鍵詞為“純色長袖襯衫”,網站將該搜索關鍵詞進行劃分后,得到的各關鍵詞單元分別為“純色”、“長袖”和“襯衫”。
步驟13,網站預先統計出規定時間段內搜索次數較多的各關鍵詞單元,并針對統計出的每個關鍵詞單元,分別設定該關鍵詞單元的提取分數,其中,關鍵詞單元在該規定時間段內的搜索次數越多,那么為該關鍵詞單元設定的提取分數就越大,也可以直接將關鍵詞單元在該規定時間段內的搜索次數設定為提取分數,網站將統計出的各關鍵詞單元及其提取分數對應保存到中心詞詞典中。
步驟14,網站將步驟12劃分出的各關鍵詞單元,分別與中心詞詞典中存儲的各關鍵詞單元進行匹配。
步驟15,網站針對步驟14匹配成功的每個關鍵詞單元,分別在上述中心詞詞典中查找該關鍵詞單元對應的提取分數。
步驟16,網站按照提取分數由高到低的順序,將步驟14匹配成功的各關鍵詞單元進行排序,并將前預定數目個關鍵詞單元確定為該搜索關鍵詞的中心詞。
由上述處理過程可知,現有技術是根據中心詞詞典從搜索關鍵詞中提取中心詞的,而中心詞詞典是預先根據規定時間段內關鍵詞單元的搜索次數設定的,但是搜索次數并不能反映用戶的搜索意圖,這樣就會出現根據上述中心詞詞典提取出的中心詞并不能準確反映用戶搜索意圖的情況。例如,用戶輸入的搜索關鍵詞為“打折手機”,進行關鍵詞單元劃分后得到“打折”和“手機”這兩個關鍵詞單元,由于“打折”這個關鍵詞單元在規定時間段內的搜索次數比“手機”這個關鍵詞單元在規定時間段內的搜索次數多,因此在上述中心詞詞典中,“打折”的提取分數要比“手機”的提取分數高,從而網站將“打折”確定為中心詞,但是在劃分出的兩個關鍵詞單元中,能夠反映用戶搜索意圖的關鍵詞單元應該是“手機”,而不是“打折”。由上可見,網站根據中心詞詞典提取出的中心詞可能不準確,不能準確反映用戶的搜索意圖,如果網站按照這些中心詞來為用戶搜索信息,那么搜索到的信息中可能并不包含用戶想要獲取的信息,用戶也就不會點擊瀏覽這些信息,但是網站依然會將這些信息提供給用戶,從而浪費了網站較多的處理資源。
發明內容
本申請實施例提供一種確定中心詞的方法及裝置、搜索方法及裝置,用以解決現有技術中在確定中心詞時浪費了網站較多的處理資源的問題。
本申請實施例技術方案如下:
一種確定中心詞的方法,該方法包括:將用戶輸入的搜索關鍵詞劃分為各關鍵詞單元;并確定劃分出的各關鍵詞單元的詞性;從劃分出的各關鍵詞單元中,提取出詞性為名詞的關鍵詞單元;并將提取出的關鍵詞單元確定為所述搜索關鍵詞的中心詞。
一種搜索方法,該方法包括:接收用戶輸入的搜索關鍵詞;根據上述確定中心詞的方法,確定所述搜索關鍵詞的中心詞;根據確定出的所述搜索關鍵詞的中心詞,進行搜索,并返回搜索結果。
一種確定中心詞的裝置,包括:關鍵詞劃分單元,用于將用戶輸入的搜索關鍵詞劃分為各關鍵詞單元;詞性確定單元,用于確定關鍵詞劃分單元劃分出的各關鍵詞單元的詞性;關鍵詞提取單元,用于從關鍵詞劃分單元劃分出的各關鍵詞單元中,提取出詞性為名詞的關鍵詞單元;第一中心詞確定單元,用于將關鍵詞提取單元提取出的關鍵詞單元確定為所述搜索關鍵詞的中心詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110369651.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鏡頭模組組裝治具
- 下一篇:一種計數精準且分裝效率高的藥片計數分裝機





