[發明專利]一種面向知識庫更新的實體細粒度分類方法與系統有效
| 申請號: | 201510033050.4 | 申請日: | 2015-01-22 |
| 公開(公告)號: | CN104615687B | 公開(公告)日: | 2018-05-22 |
| 發明(設計)人: | 程學旗;王元卓;林海倫;賈巖濤;靳小龍;熊錦華;李曼玲;常雨驍;許洪波 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇;李科 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 知識庫 更新 實體 細粒度 分類 方法 系統 | ||
1.一種面向知識庫更新的實體細粒度分類方法,包括:
步驟1)、從文本中識別出實體;
步驟2)、將識別出的實體、知識庫中與其相關的實體以及相關實體在知識庫中的分類作為結點構建依賴圖,其中依賴圖中的邊的權值表示該邊連接的兩個結點之間的相關程度;
所述步驟2)進一步包括:
步驟21)、根據語義相容度獲得識別出的實體在知識庫中的相關實體,并且獲得該相關實體在知識庫中的分類;其中,語義相容度表示識別出的實體的上下文信息與相關實體的描述文本的相似度;
步驟22)、將識別出的實體、知識庫中與其相關的實體以及相關實體在知識庫中的分類作為結點;
步驟23)、在表示識別出的實體的結點和表示相關實體的結點之間添加邊,邊的權值為該識別出的實體與該相關實體之間的語義相容度;
在表示相關實體的結點和表示分類的結點之間添加邊,邊的權值指示該相關實體是否屬于該分類;
在表示相關實體的結點之間添加邊,邊的權值為該相關實體之間的語義相關度;
在表示分類的結點之間添加邊,邊的權值為該分類之間的相關度;
步驟3)、通過在所述依賴圖上執行重啟動隨機游走,得到識別出的實體所屬的分類。
2.根據權利要求1所述的方法,其中,根據下式計算語義相容度:
其中,SC(em,e)表示識別出的實體em與知識庫中的相關實體e的語義相容度,X表示em的上下文信息,T表示e的描述文本,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510033050.4/1.html,轉載請聲明來源鉆瓜專利網。





