[發明專利]基于拓撲關系圖的實體網頁鏈接的獲取技術在審
| 申請號: | 201810516375.1 | 申請日: | 2018-05-25 |
| 公開(公告)號: | CN110598073A | 公開(公告)日: | 2019-12-20 |
| 發明(設計)人: | 蘇柏;馬超;周長海;華抒軍;陸掾;文寧 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/955;G06F16/958 |
| 代理公司: | 11353 北京市惠誠律師事務所 | 代理人: | 逯博 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網頁 拓撲關系圖 候選實體 準確度 關聯關系 網頁鏈接 鏈接 權重 主語 挖掘 概率 | ||
本文公開的基于拓撲關系圖的實體網頁鏈接的獲取技術,基于網頁間的拓撲關系圖來確定候選實體網頁的權重值,能夠充分挖掘候選實體網頁與主語實體網頁間的關聯關系,從而提高找到值鏈接的概率以及準確度。
背景技術
隨著互聯網的發展,網絡數據內容呈現爆炸式增長的態勢。由于互聯網內容的大規模、異質多元、組織結構松散的特點,給人們有效獲取信息和知識提出了挑戰。知識圖譜(Knowledge Graph)以其強大的語義處理能力和開放信息組織能力,為互聯網時代的知識化組織和智能應用奠定了基礎。知識圖譜用于描述實體(Entity)以及實體之間的關系。隨著人工智能的技術發展和應用,知識圖譜作為人工智能的關鍵技術之一,已被廣泛應用于智能搜索、智能問答、個性化推薦、內容分發等領域。
發明內容
提供本發明實施例內容是為了以精簡的形式介紹將在以下詳細描述中進一步描述的一些概念。本發明內容并不旨在標識所要求保護主題的關鍵特征或必要特征,也不旨在用于限制所要求保護主題的范圍。
本文公開的基于拓撲關系圖的實體網頁鏈接的獲取技術,基于網頁間的拓撲關系圖來確定候選實體網頁的權重值,能夠充分挖掘候選實體網頁與主語實體網頁間的關聯關系,從而提高找到值鏈接的概率以及準確度。
上述說明僅是本公開技術方案的概述,為了能夠更清楚了解本公開的技術手段,而可依照說明書的內容予以實施,并且為了讓本公開的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本公開的具體實施方式。
附圖說明
圖1為描繪應用本文實體網頁鏈接的獲取技術的示例環境之一的框圖。
圖2為正向拓撲關系圖的示例結構框圖;
圖3為基于正向拓撲關系圖進行第一輪隨機游走的示例框圖;
圖4為基于正向拓撲關系圖進行第二輪隨機游走的示例框圖;
圖5為基于正向拓撲關系圖的隨機游走結果的示例框圖;
圖6為反向拓撲關系圖的示例結構之一的框圖;
圖7為反向拓撲關系圖的示例結構之二的框圖;
圖8為基于圖6的反向拓撲關系圖進行第一輪隨機游走的示例框圖;
圖9為基于圖6的反向拓撲關系圖進行第二輪隨機游走的示例框圖;
圖10為基于圖7的反向拓撲關系圖進行第一輪隨機游走的示例框圖;
圖11為基于圖7的反向拓撲關系圖進行第二輪隨機游走的示例框圖;
圖12為描繪本文的實體網頁鏈接的獲取方法的流程示意圖;
圖13為示例性的具有可移動性的電子設備的結構框圖;
圖14為示例性的計算設備的結構框圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
本文中,術語“技術”、“機制”可以指代例如(一個或多個)系統、(一個或多個)方法、計算機可讀指令、(一個或多個)模塊、算法、硬件邏輯(例如,現場可編程門陣列(FPGA))、專用集成電路(ASIC)、專用標準產品(ASSP)、片上系統(SOC)、復雜可編程邏輯設備(CPLD)和/或上述上下文以及在本文檔通篇中所允許的(一項或多項)其它技術。
概覽
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810516375.1/2.html,轉載請聲明來源鉆瓜專利網。





