[發明專利]一種自定義規則的文本信息抽取結果篩選方法及裝置有效
| 申請號: | 201710961777.8 | 申請日: | 2017-10-16 |
| 公開(公告)號: | CN107729481B | 公開(公告)日: | 2020-10-13 |
| 發明(設計)人: | 席麗娜;李德彥;晉耀紅 | 申請(專利權)人: | 鼎富智能科技有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/33 |
| 代理公司: | 北京弘權知識產權代理事務所(普通合伙) 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 230000 安徽省合肥市*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 自定義 規則 文本 信息 抽取 結果 篩選 方法 裝置 | ||
1.一種自定義規則的文本信息抽取結果篩選方法,其特征在于,所述方法包括:
獲取待抽取文本信息和預設的模型樹,所述模型樹包括至少若干個節點和每個節點對應的抽取表達式集,所述抽取表達式集包括至少一個抽取表達式;
響應于用戶選擇所述節點的操作,利用所述模型樹中所選節點對應的抽取表達式集對所述待抽取文本信息進行信息抽取,得到抽取結果;
獲取所述模型樹對應的預設節點路徑;
利用所述預設節點路徑的終止節點,按照預設的篩選規則,對所述抽取結果進行篩選,得到篩選結果,所述終止節點為節點路徑的結束的節點;所述預設的篩選規則為全節點篩選規則、子節點篩選規則或當前節點篩選規則;
當預設的篩選規則為當前節點篩選規則時,根據所述預設節點路徑的終止節點,查找與所述終止節點對應的抽取結果。
2.如權利要求1所述的方法,其特征在于,當預設的篩選規則為子節點篩選規則時,所述利用所述預設節點路徑的終止節點,按照預設的篩選規則,對所述抽取結果進行篩選包括:
判斷所述預設節點路徑的終止節點是否具有子節點;
如果所述終止節點具有子節點,則根據所述子節點,查找與所述子節點相對應的抽取結果。
3.如權利要求1所述的方法,其特征在于,當預設的篩選規則為全節點篩選規則時,所述利用所述節點路徑的終止節點,按照預設的篩選規則,對所述抽取結果進行篩選包括:
判斷所述預設節點路徑的終止節點是否具有子孫節點,所述子孫節點為后繼于所述終止節點的第一層級至第N層級的所有節點,其中,后繼于所述終止節點的第N層級的節點為最末層級節點,N為大于1的正整數;
如果所述節點路徑的終止節點具有子孫節點,則根據所述子孫節點,查找與所述子孫節點相對應的抽取結果。
4.如權利要求1-3任意一項所述的方法,其特征在于,所述利用所述預設節點路徑的終止節點,按照預設的篩選規則,對所述抽取結果進行篩選,得到篩選結果之后包括:
根據所述篩選結果及所述模型樹中與所述篩選結果相對應的節點,生成key-value鍵值對集;
將所述key-value鍵值對集輸出。
5.一種基于文本信息抽取結果的篩選裝置,其特征在于,所述裝置包括:
第一獲取模塊,用于獲取待抽取文本信息和預設的模型樹,所述模型樹包括至少若干個節點和每個節點對應的抽取表達式集,所述抽取表達式集包括至少一個抽取表達式;
抽取模塊,用于響應于用戶選擇所述節點的操作,利用所述模型樹中所選節點對應的抽取表達式集對所述待抽取文本信息進行信息抽取,得到抽取結果;
第二獲取模塊,用于獲取所述模型樹對應的預設節點路徑;
篩選模塊,用于利用所述預設節點路徑的終止節點,按照預設的篩選規則,對所述抽取結果進行篩選,得到篩選結果,所述終止節點為節點路徑的結束的節點;所述預設的篩選規則為全節點篩選規則、子節點篩選規則或當前節點篩選規則;
所述預設的篩選規則為當前節點篩選規則時,所述篩選模塊包括:
第三查找單元,用于根據所述預設節點路徑的終止節點,查找與所述終止節點對應的抽取結果。
6.如權利要求5所述的裝置,其特征在于,當預設的篩選規則為子節點篩選規則時,所述篩選模塊包括:
第一判斷單元,用于判斷所述預設節點路徑的終止節點是否具有子節點;
第一查找單元,用于如果所述節點路徑的終止節點具有子節點,則根據所述子節點,查找與所述子節點相對應的抽取結果。
7.如權利要求5所述的裝置,其特征在于,當預設的篩選規則為全節點篩選規則時,所述篩選模塊包括:
第二判斷單元,用于判斷所述預設節點路徑的終止節點是否具有子孫節點,所述子孫節點為后繼于所述終止節點的第一層級至第N層級的所有節點,其中,后繼于所述終止節點的第N層級的節點為最末層級節點,N為大于1的正整數;
第二查找單元,用于如果所述節點路徑的終止節點具有子孫節點,則根據所述子孫節點,查找與所述子孫節點相對應的抽取結果。
8.如權利要求5-7任意一項所述的裝置,其特征在于,所述裝置還包括:
生成單元,用于根據所述篩選結果及所述模型樹中與所述篩選結果相對應的節點,生成key-value鍵值對集;
輸出單元,用于將所述key-value鍵值對集輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鼎富智能科技有限公司,未經鼎富智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710961777.8/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





