[發明專利]內容檢索方法、終端、服務器、電子設備及存儲介質有效
| 申請號: | 201710872842.X | 申請日: | 2017-09-25 |
| 公開(公告)號: | CN109948073B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 金剛銘;葉駿;徐羽;范躍偉;胡博;李未;周疏影;王劍;鈄偉雨;劉秀芳;呂雪;何楓 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955;G06F16/953;G06F16/36 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 孫曉麗 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 內容 檢索 方法 終端 服務器 電子設備 存儲 介質 | ||
1.一種內容檢索方法,其特征在于,包括:
從后臺服務器接收頁面內容檢索列表,并根據所述頁面內容檢索列表的內容進行頁面內容檢索觸發提示,以便用戶根據所述頁面內容檢索觸發提示發出頁面內容檢索觸發指令,所述頁面內容檢索列表中包括頁面內容支持頁面內容檢索的頁面;
接收所述頁面內容檢索觸發指令;
根據所述頁面內容檢索觸發指令獲取頁面內容的頁面地址;
將所述頁面地址發送至所述后臺服務器;
從所述后臺服務器接收進行優先級調整的內容實體知識圖譜,展示所述內容實體知識圖譜,以便用戶進行關鍵詞內容檢索操作;
其中,所述后臺服務器用于根據所述頁面地址提取所述頁面內容;使用頁面爬蟲,提取所述頁面內容中的標題、副標題、作者以及具體內容中至少一個;對所述標題、副標題、作者以及具體內容中至少一個進行分詞、命名實體識別以及詞頻-逆向文件頻率文本處理操作,將所述頁面內容抽象成若干個內容實體;根據提取的所述內容實體以及所述內容實體之間的關聯性,創建所述頁面內容對應的內容實體知識圖譜;讀取內容檢索終端用戶的用戶畫像,基于所述用戶畫像,對所述內容實體知識圖譜進行內容優先級調整,所述用戶畫像是指通過用戶行為得出的用戶對不同內容實體的興趣值;其中,所述內容實體知識圖譜通過多個層級結構來表示不同內容實體之間的相互聯系,所述內容實體越重要,所述內容實體所處的層級結構越高,所述內容實體之間的關聯性是通過以所述內容實體作為檢索詞,通過搜索引擎技術從后臺數據庫中提取的具體數據來獲取,所述內容實體之間的關聯性包括所述內容實體的實體屬性以及相關內容實體之間的實體關系;
響應于對所述內容實體知識圖譜上的關鍵詞的選定操作,進行關鍵詞內容檢索操作,或者,根據選定的關鍵詞生成新的內容實體知識圖譜。
2.根據權利要求1所述的內容檢索方法,其特征在于,所述接收所述頁面內容檢索觸發指令的步驟為:
根據用戶在頁面內容展示界面上的觸控操作,生成所述頁面內容檢索觸發指令。
3.一種內容檢索方法,其特征在于,包括:
從檢索終端接收頁面內容的頁面地址;
根據所述頁面地址提取所述頁面內容;
使用頁面爬蟲,提取所述頁面內容中的標題、副標題、作者以及具體內容中至少一個;對所述標題、副標題、作者以及具體內容中至少一個進行分詞、命名實體識別以及詞頻-逆向文件頻率文本處理操作,將所述頁面內容抽象成若干個內容實體;
根據提取的所述內容實體以及所述內容實體之間的關聯性,創建所述頁面內容對應的內容實體知識圖譜;其中,所述內容實體知識圖譜通過多個層級結構來表示不同內容實體之間的相互聯系,所述內容實體越重要,所述內容實體所處的層級結構越高;其中,所述內容實體之間的關聯性是通過以所述內容實體作為檢索詞,通過搜索引擎技術從后臺數據庫中提起的具體數據來獲取,所述內容實體的關聯性包括所述內容實體的實體屬性以及相關內容實體之間的實體關系;
基于預設用戶畫像,對所述內容實體知識圖譜進行內容實體優先級調整,所述用戶畫像是指通過用戶行為得出的用戶對不同內容實體的興趣值;以及
將進行優先級調整的內容實體知識圖譜發送至所述檢索終端進行展示,以便用戶進行關鍵詞內容檢索操作;
其中,所述檢索終端用于從后臺服務器接收頁面內容檢索列表,并根據所述頁面內容檢索列表的內容進行頁面內容檢索觸發提示,以便用戶根據所述頁面內容檢索觸發提示發出頁面內容檢索觸發指令,所述頁面內容檢索列表中包括頁面內容支持頁面內容檢索的頁面;接收所述頁面內容檢索觸發指令;根據所述頁面內容檢索觸發指令獲取頁面內容的頁面地址;
所述檢索終端還用于響應于對所述內容實體知識圖譜上的關鍵詞的選定操作,進行關鍵詞內容檢索操作,或者,根據選定的關鍵詞生成新的內容實體知識圖譜。
4.根據權利要求3所述的內容檢索方法,其特征在于,所述根據所述頁面地址提取所述頁面內容的步驟包括:
對所述頁面地址進行歸一化操作;
判斷服務器本地存儲器是否存儲有所述歸一化操作后的頁面地址對應的頁面內容;
如存儲有所述歸一化操作后的頁面地址對應的頁面內容,則從所述服務器本地存儲器提取所述頁面內容;以及
如未存儲有所述歸一化操作后的頁面地址對應的頁面內容,則從所述頁面地址提取所述頁面內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710872842.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:店鋪搜索信息的處理方法、裝置及設備
- 下一篇:網頁數據的標記方法及裝置
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





