[發明專利]網頁內容溯源方法、知識圖譜構建方法以及相關設備在審
| 申請號: | 202111113469.2 | 申請日: | 2021-09-18 |
| 公開(公告)號: | CN115840863A | 公開(公告)日: | 2023-03-24 |
| 發明(設計)人: | 黨倩 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F16/958 | 分類號: | G06F16/958;G06F16/36 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 陳敬華;常云敏 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁 內容 溯源 方法 知識 圖譜 構建 以及 相關 設備 | ||
本申請實施例提供了網頁內容溯源方法、知識圖譜構建方法以及相關設備,涉及終端領域;本申請中的計算機設備可以構建知識圖譜,知識圖譜中包括多個實體、以及實體之間的關系,然后可以基于知識圖譜進行網頁內容溯源,在知識圖譜中確定待溯源網頁對應的第一網頁實體,在知識圖譜中確定第一網頁實體對應的至少一個目標實體,目標實體與第一網頁實體之間存在直接或間接的關系,最后可以基于至少一個目標實體、第一網頁實體與至少一個目標實體之間的關系展示待溯源網頁的內容溯源結果;本申請可以實現自動化網頁內容溯源,提升網頁內容溯源效率。
技術領域
本申請涉及終端技術領域,尤其涉及了網頁內容溯源方法、知識圖譜構建方法以及相關設備。
背景技術
當互聯網上網頁引用了來自其他網頁的內容時,該網頁一般會通過如“引用”、“圖源”等文字標示出內容的出處,網頁在標示出處時可以標示包含該引用信息的網站名稱,比如,“數據來源X訊網”。
在實踐過程中,若用戶訪問了一個包含引用內容的網頁,想要根據網頁上標示的出處對該網頁的引用內容進行溯源,從而找到首次發布該引用內容的網頁時,用戶只能根據該網頁上標示的出處,借助搜索引擎在網絡上進行手動搜索和篩選,流程非常繁瑣且效率低下。
發明內容
有鑒于此,有必要提供網頁內容溯源方法、知識圖譜構建方法以及相關設備,其可克服上述問題,實現自動化網頁內容溯源,免去用戶手動搜索溯源的過程,大幅提升網頁內容溯源的效率。
第一方面,本申請的一實施例提供了一種網頁內容溯源方法應用于服務器,方法包括:
查詢待溯源網頁在知識圖譜中對應的第一網頁實體,知識圖譜包括多個實體、以及各個實體之間的關系;根據知識圖譜以及第一網頁實體確定至少一個目標實體,至少一個目標實體與第一網頁實體之間存在直接或者間接的關系;確定待溯源網頁的溯源結果,溯源結果包括至少一個目標實體對應的至少一個網頁或網站以及每個網頁或網站之間的關系。
通過采用該技術方案,可以借助知識圖譜對待溯源網頁進行自動溯源,有效提升網頁內容溯源的效率。
在一種可能的實現方式中,多個實體包括至少一個網站實體和至少一個網頁實體,實體之間的關系包括引用關系和/或歸屬關系,引用關系或者歸屬關系通過網站實體的關系屬性或者網頁實體的關系屬性進行確定。
其中,關系屬性可以包括引用對象屬性和歸屬對象屬性。
通過采用該技術方案,可以在知識圖譜的多個網頁實體和多個網站實體中,確定待溯源網頁對應的第一網頁實體,并根據歸屬關系和引用關系,確定第一網頁實體存在直接或間接關系的目標實體,實現自動化網頁溯源,提升內容溯源效率。
在一種可能的實現方式中,網頁實體還包括網頁地址屬性,查詢待溯源網頁在知識圖譜中對應的第一網頁實體,包括:根據溯源網頁的網頁地址以及知識圖譜中所有網頁實體的網頁地址屬性,確定待溯源網頁在知識圖譜中對應的第一網頁實體。
通過采用該技術方案,可以根據知識圖譜中每個實體的網頁地址屬性的屬性值(即網頁地址)、以及待溯源網頁的網頁地址,精準確定待溯源網頁在知識圖譜中對應的第一網頁實體。
在一種可能的實現方式中,網頁實體還包括網頁標識屬性,查詢待溯源網頁在知識圖譜中對應的第一網頁實體,包括:根據待溯源網頁的網頁地址,生成待溯源網頁對應的網頁標識;根據待溯源網頁對應的網頁標識、以及知識圖譜中所有網頁實體的網頁標識屬性,確定待溯源網頁在知識圖譜中對應的第一網頁實體。
通過采用該技術方案,可以由待溯源網頁的網頁地址生成待溯源網頁的網頁標識,并通過知識圖中每個實體的網頁標識屬性的屬性值(即網頁標識),精準確定待溯源網頁在知識圖譜中對應的第一網頁實體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111113469.2/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





