[發明專利]一種詞條推薦方法及裝置在審
| 申請號: | 201210272391.3 | 申請日: | 2012-08-01 |
| 公開(公告)號: | CN102831185A | 公開(公告)日: | 2012-12-19 |
| 發明(設計)人: | 徐興軍 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何青瓦;李慶波 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 詞條 推薦 方法 裝置 | ||
1.一種詞條推薦方法,其特征在于,該方法包括:
對預置詞條集合中的元素關聯信息進行初始化;
根據詞條在文檔中的共現關系,在所述詞條集合中,增加對應元素之間的關聯度;
獲得詞條A之后,利用詞條A在所述詞條集合中的關聯詞條,構成詞條A的推薦結果。
2.根據權利要求1所述的方法,其特征在于,所述根據詞條在文檔中的共現關系,在所述詞條集合中,增加對應元素之間的關聯度,包括:
對于給定文檔,統計集合中元素在該文檔中的TF-IDF值;
確定TF-IDF值滿足預設要求的至少兩個詞條,在所述詞條集合中,增加對應元素之間的關聯度;
其中,所述TF-IDF為:詞頻-逆文檔頻率。
3.根據權利要求1所述的方法,其特征在于,所述根據詞條在文檔中的共現關系,在所述詞條集合中,增加對應元素之間的關聯度,包括:
對于給定文檔,統計集合中元素在該文檔中的出現位置;
如果兩個詞條在文檔中的位置關系滿足預設要求,則在所述詞條集合中,增加對應元素之間的關聯度。
4.根據權利要求1所述的方法,其特征在于,所述利用詞條A在所述詞條集合中的關聯詞條,構成詞條A的推薦結果,包括:
根據關聯詞條與詞條A的關聯距離,優先選取關聯距離較小的關聯詞條構成推薦結果。
5.根據權利要求4所述的方法,其特征在于,該方法還包括:
在多個關聯詞條與詞條A的關聯距離相同的情況下,根據關聯詞條與詞條A的關聯度大小確定推薦結果。
6.根據權利要求5所述的方法,其特征在于,所述根據關聯詞條與詞條A的關聯度大小確定推薦結果,包括:
在多個關聯詞條與詞條A直接關聯的情況下,優先選取關聯度較大的詞條構成推薦結果。
7.根據權利要求5所述的方法,其特征在于,所述根據關聯詞條與詞條A的關聯度大小確定推薦結果,包括:
在多個關聯詞條與詞條A間接關聯的情況下,優先選取路徑關聯度乘積較大的詞條構成推薦結果。
8.一種詞條推薦裝置,其特征在于,該裝置包括:
關聯信息初始化單元,用于對預置詞條集合中的元素關聯信息進行初始化;
關聯信息管理單元,用于根據詞條在文檔中的共現關系,在所述詞條集合中,增加對應元素之間的關聯度;
推薦單元,用于在獲得詞條A之后,利用詞條A在所述詞條集合中的關聯詞條,構成詞條A的推薦結果。
9.根據權利要求8所述的裝置,其特征在于,所述關聯信息管理單元,具體用于:
對于給定文檔,統計集合中元素在該文檔中的TF-IDF值;
確定TF-IDF值滿足預設要求的至少兩個詞條,在所述詞條集合中,增加對應元素之間的關聯度;
其中,所述TF-IDF為:詞頻-逆文檔頻率。
10.根據權利要求8所述的裝置,其特征在于,所述關聯信息管理單元,具體用于:
對于給定文檔,統計集合中元素在該文檔中的出現位置;
如果兩個詞條在文檔中的位置關系滿足預設要求,則在所述詞條集合中,增加對應元素之間的關聯度。
11.根據權利要求8所述的裝置,其特征在于,所述推薦單元,具體用于:
根據關聯詞條與詞條A的關聯距離,優先選取關聯距離較小的關聯詞條構成推薦結果。
12.根據權利要求11所述的裝置,其特征在于,所述推薦單元,還用于:
在多個關聯詞條與詞條A的關聯距離相同的情況下,根據關聯詞條與詞條A的關聯度大小確定推薦結果。
13.根據權利要求12所述的裝置,其特征在于,所述推薦單元,具體用于:
在多個關聯詞條與詞條A直接關聯的情況下,優先選取關聯度較大的詞條構成推薦結果。
14.根據權利要求12所述的裝置,其特征在于,所述推薦單元,具體用于:
在多個關聯詞條與詞條A間接關聯的情況下,優先選取路徑關聯度乘積較大的詞條構成推薦結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210272391.3/1.html,轉載請聲明來源鉆瓜專利網。





