[發明專利]實體詞的熱度獲取方法及裝置有效
| 申請號: | 201810203602.5 | 申請日: | 2018-03-13 |
| 公開(公告)號: | CN110309189B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 李瀟;鄭孫聰 | 申請(專利權)人: | 深圳市騰訊計算機系統有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06N5/022;G06F18/25 |
| 代理公司: | 深圳市聯鼎知識產權代理有限公司 44232 | 代理人: | 劉抗美 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體詞 熱度 獲取 方法 裝置 | ||
1.一種實體詞的熱度獲取方法,其特征在于,包括:
獲取搜索日志數據集,所述搜索日志數據集為搜索者通過搜索工具查詢指定內容后留下的查詢數據構成的數據集合;
根據實體詞在所述搜索日志數據集中的提及量,獲得所述實體詞的關注度;
根據所述實體詞在百科網絡中所對應網頁地址的網頁重要等級以及所述實體詞在知識圖譜中的實體重要等級,通過多源融合獲得所述實體詞的認知普及度;
將所述實體詞的認知普及度與所述實體詞的關注度進行融合,獲得所述實體詞的當前熱度。
2.根據權利要求1所述的方法,其特征在于,所述根據實體詞在所述搜索日志數據集中的提及量,獲得所述實體詞的關注度之前,所述方法還包括:
根據所述實體詞在所述搜索日志數據集中的查詢語句,將所述查詢語句與表達方式模板進行匹配,獲得包含所述實體詞的查詢語句與所述表達方式模板之間的匹配成功次數;
根據所述實體詞在所述搜索日志數據集中的提及次數以及所述匹配成功次數,累計獲得所述實體詞的提及量。
3.根據權利要求1所述的方法,其特征在于,所述根據實體詞在所述搜索日志數據集中的提及量,獲得所述實體詞的關注度之前,所述方法還包括:
根據已構建的實體屬性關系,在所述搜索日志數據集中統計所述實體詞與對應屬性詞同時出現的次數,獲得所述實體詞的正向匹配次數;
根據所述實體詞在所述搜索日志數據集中的提及次數以及所述正向匹配次數,累計獲得所述實體詞的提及量。
4.根據權利要求1所述的方法,其特征在于,所述根據實體詞在所述搜索日志數據集中的提及量,獲得所述實體詞的關注度之前,所述方法還包括:
根據已構建的實體屬性關系,在所述搜索日志數據集中統計所述實體詞作為屬性詞與對應實體同時出現的次數,獲得所述實體詞的反向匹配次數;
根據所述實體詞在所述搜索日志數據集中的提及次數以及所述反向匹配次數,累計獲得所述實體詞的提及量。
5.根據權利要求1所述的方法,其特征在于,所述根據實體詞在所述搜索日志數據集中的提及量,獲得所述實體詞的關注度,包括:
對所述實體詞的提及量進行歸一化,得到所述實體詞的關注度。
6.根據權利要求1所述的方法,其特征在于,所述根據所述實體詞在百科網絡中所對應網頁地址的網頁重要等級以及所述實體詞在知識圖譜中的實體重要等級,通過多源融合獲得所述實體詞的認知普及度之前,所述方法還包括:
根據所述實體詞的標識信息,從百科網絡中獲取所述標識信息對應的網頁地址;
根據所述百科網絡中已構建的網頁鏈接關系,通過pagerank算法計算所述網頁地址對應的網頁重要等級。
7.根據權利要求1所述的方法,其特征在于,所述根據所述實體詞在百科網絡中所對應網頁地址的網頁重要等級以及所述實體詞在知識圖譜中的實體重要等級,通過多源融合獲得所述實體詞的認知普及度之前,所述方法還包括:
根據所述實體詞在知識圖譜中的實體鏈接關系,通過pagerank算法計算所述實體詞的實體重要等級。
8.根據權利要求1所述的方法,其特征在于,將所述實體詞的認知普及度與所述實體詞的關注度進行融合,獲得所述實體詞的當前熱度,包括:
將所述實體詞的認知普及度與關注度,按照預設權重系數加權求和,獲得所述實體詞的當前熱度。
9.一種實體詞的熱度獲取裝置,其特征在于,所述裝置包括:
日志獲取模塊,用于獲取搜索日志數據集,所述搜索日志數據集為搜索者通過搜索工具查詢指定內容后留下的查詢數據構成的數據集合;
關注度獲得模塊,用于根據實體詞在所述搜索日志數據集中的提及量,獲得所述實體詞的關注度;
熱度獲得模塊,用于根據所述實體詞在百科網絡中所對應網頁地址的網頁重要等級以及所述實體詞在知識圖譜中的實體重要等級,通過多源融合獲得所述實體詞的認知普及度;將所述實體詞的認知普及度與所述實體詞的關注度進行融合,獲得所述實體詞的當前熱度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市騰訊計算機系統有限公司,未經深圳市騰訊計算機系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810203602.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:內容聚類方法及裝置
- 下一篇:一種基于車載終端的車友推薦方法及系統、車載終端





