[發明專利]一種新型實體指代消解的方法及其系統在審
| 申請號: | 201710255732.9 | 申請日: | 2017-04-19 |
| 公開(公告)號: | CN107168947A | 公開(公告)日: | 2017-09-15 |
| 發明(設計)人: | 林輝 | 申請(專利權)人: | 成都準星云學科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/30 |
| 代理公司: | 成都環泰知識產權代理事務所(特殊普通合伙)51242 | 代理人: | 李斌,鄒翠 |
| 地址: | 610000 四川省成都市高*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 新型 實體 指代 消解 方法 及其 系統 | ||
1.一種新型實體指代消解的方法,其特征在于,包括以下步驟:
a、確定某一原始文本,并對該原始文本進行文本分詞操作;
b、判斷分詞是否成功,如果是,則進入步驟c;如果否,則重新進入步驟a;
c、對分詞成功的文本進行文本標注;
d、判斷標注后的文本是否存在實體指代問題,如果是,則進行實體替換操作,進入步驟e;如果否,則進入步驟f;
e、判斷實體替換操作是否成功,如果是,則進入步驟f;如果否,則重新進入步驟d;
f、獲取屬性齊全的實體,將需要替代的實體替換為新的屬性齊全的實體。
2.根據權利要求1所述新型實體指代消解的方法,其特征在于,所述步驟d和e中的實體替換操作具體包括以下步驟:
執行實體指代存操作,遍歷標注后的文本,找出文本中的實體,并將這些實體及其屬性分別存入對應的類中。
3.根據權利要求2所述新型實體指代消解的方法,其特征在于,所述步驟d和e中的實體替換操作還包括以下步驟:
執行實體指代取操作,在實體指代存操作完成后,再次遍歷標注后的文本,獲取需要進行替代的實體,并從存儲的實體中找到與之對應的實體,將存儲實體的屬性賦值給該需要替代的實體。
4.一種新型實體指代消解的系統,其特征在于,包括文本分詞模塊、分詞判斷模塊、文本標注模塊、指代判斷模塊、實體替換模塊和替換完成模塊,其中:
文本分詞模塊,用于確定某一原始文本,并對該原始文本進行文本分詞操作;
分詞判斷模塊,判斷分詞是否成功,如果是,則跳轉到文本標注模塊,對文本進行標注;如果否,則重新對原始文本進行文本分詞操作;
文本標注模塊,用于對分詞成功的文本進行文本標注;
指代判斷模塊,判斷標注后的文本是否存在實體指代問題,如果是,則進行實體替換操作;如果否,則結束判斷,獲得屬性齊全的實體;
實體替換模塊,判斷實體替換操作是否成功,如果是,則獲得屬性齊全的實體;如果否,則重新進行實體替換操作;
替換完成模塊,用于獲取屬性齊全的實體,將需要替代的實體替換為新的屬性齊全的實體。
5.根據權利要求4所述新型實體指代消解的系統,其特征在于,所述實體替換模塊包括實體指代存子模塊,用于執行實體指代存操作,遍歷標注后的文本,找出文本中的實體,并將這些實體及其屬性分別存入對應的類中。
6.根據權利要求5所述新型實體指代消解的系統,其特征在于,所述實體替換模塊包括實體指代取子模塊,用于執行實體指代取操作,在實體指代存操作完成后,再次遍歷標注后的文本,獲取需要進行替代的實體,并從存儲的實體中找到與之對應的實體,將存儲實體的屬性賦值給該需要替代的實體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都準星云學科技有限公司,未經成都準星云學科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710255732.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種醫療文本數據的命名實體識別方法
- 下一篇:一種語句識別方法與系統





