[發明專利]工具書校驗方法和工具書校驗裝置有效
| 申請號: | 201810175967.1 | 申請日: | 2018-03-02 |
| 公開(公告)號: | CN110309175B | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 石林 | 申請(專利權)人: | 北大方正集團有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455;G06F40/16 |
| 代理公司: | 北京友聯知識產權代理事務所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
| 地址: | 100871 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 工具書 校驗 方法 裝置 | ||
1.一種工具書校驗方法,其特征在于,包括:
確定參考詞庫中的任兩個預存名詞之間的對應關系,以及與所述對應關系匹配的正則表達式;以確定所述參考詞庫中詞條與釋文名詞之間的對應關系;
采用所述正則表達式提取工具書中用于對任一詞條進行注釋的釋文名詞;
根據所述對應關系校驗任一所述詞條的注釋是否正確;
采用所述正則表達式校驗指定數據庫,以濾除所述指定數據庫中的非法信息;
將濾除所述非法信息的指定數據庫確定為所述參考詞庫。
2.根據權利要求1所述的工具書校驗方法,其特征在于,所述根據所述對應關系校驗任一所述詞條的注釋是否正確,具體包括:
根據所述對應關系確定任一所述詞條的釋文名詞對應的預存名詞的個數;
判斷所述個數是否大于或等于預設個數;
在判定所述個數大于或等于所述預設個數時,記錄所述詞條對應的釋文名詞為不一致釋文名詞。
3.根據權利要求2所述的工具書校驗方法,其特征在于,還包括:
在檢測到任一所述釋文名詞與所述預存名詞之間不存在所述對應關系時,將所述釋文名詞記錄為新增釋文名詞。
4.根據權利要求3所述的工具書校驗方法,其特征在于,還包括:
以列表形式對應存儲任一所述詞條與相應的所述不一致釋文名詞,以及對應存儲任一所述詞條與相應的所述新增釋文名詞。
5.一種工具書校驗裝置,其特征在于,包括:
確定單元,用于確定參考詞庫中的任兩個預存名詞之間的對應關系,以及與所述對應關系匹配的正則表達式;以確定所述參考詞庫中詞條與釋文名詞之間的對應關系;
提取單元,用于采用所述正則表達式提取工具書中用于對任一詞條進行注釋的釋文名詞;
校驗單元,用于根據所述對應關系校驗任一所述詞條的注釋是否正確;
濾除單元,用于采用所述正則表達式校驗指定數據庫,以濾除所述指定數據庫中的非法信息;
所述確定單元還用于:將濾除所述非法信息的指定數據庫確定為所述參考詞庫。
6.根據權利要求5所述的工具書校驗裝置,其特征在于,所述確定單元還包括:
計數子單元,用于根據所述對應關系確定任一所述詞條的釋文名詞對應的預存名詞的個數;
判斷子單元,用于判斷所述個數是否大于或等于預設個數;
記錄子單元,用于在判定所述個數大于或等于所述預設個數時,記錄所述詞條對應的釋文名詞為不一致釋文名詞。
7.根據權利要求6所述的工具書校驗裝置,其特征在于,
所述記錄子單元還用于:在檢測到任一所述釋文名詞與所述預存名詞之間不存在所述對應關系時,將所述釋文名詞記錄為新增釋文名詞。
8.根據權利要求7所述的工具書校驗裝置,其特征在于,所述確定單元還包括:
存儲子單元,用于以列表形式對應存儲任一所述詞條與相應的所述不一致釋文名詞,以及對應存儲任一所述詞條與相應的所述新增釋文名詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京北大方正電子有限公司,未經北大方正集團有限公司;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810175967.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據查詢方法、裝置和服務器
- 下一篇:一種數據處理方法和數據中轉站





