[發明專利]工具書中特征字的標注方法和設備有效
| 申請號: | 202010037229.8 | 申請日: | 2020-01-14 |
| 公開(公告)號: | CN111274352B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 耿紅霞 | 申請(專利權)人: | 北大方正集團有限公司;北京北大方正電子有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 張曉霞;劉芳 |
| 地址: | 100871 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 工具書 特征 標注 方法 設備 | ||
本發明提供一種工具書中特征字的標注方法和設備。該方法包括:將工具書中包含的字和特征字庫中包含的特征字進行匹配,確定所述工具書包含的至少一個特征字,所述特征字的類型包括:生僻字和超綱字中至少一種;獲取所述至少一個特征字各自對應的標識碼;根據所述至少一個特征字各自對應的標識碼,確定所述至少一個特征字各自對應的釋義;根據所述至少一個特征字,以及所述至少一個特征字各自對應的釋義,對所述至少一個特征字進行標注。和現有技術中編輯人員人工逐個查找特征字以及逐個解釋其含義相比,大大提升了特征字標注的效率。
技術領域
本發明涉及數據處理技術領域,尤其涉及一種工具書中特征字的標注方法和設備。
背景技術
對工具書中具有某些共性的字/詞進行標注,可以幫助使用者更便捷地理解這些字/詞的相關知識,比如:對工具書中生僻字/詞進行標注,可以幫助使用者快速了解生僻字/詞的讀音以及含義,因此,這種標注的做法對提升用戶體驗有著重要意義。如何提高對工具書中上述字/詞的標注效率是目前較為關注問題。
現有技術中,首先把需要標注的工具書內容打印出來,編輯人員逐個查找文本中需要標注的字/詞,然后對查找出來的字/詞的逐個標注其釋義,最后交給排版人員排版。顯然,上述標注方法完全是依賴人工進行的,標注效率低。
發明內容
本發明提供一種工具書中特征字的標注方法和設備,用以提高特征字標注效率。
第一方面,本發明提供一種工具書中特征字的標注方法,包括:
將工具書中包含的字和特征字庫中包含的特征字進行匹配,確定所述工具書包含的至少一個特征字,所述特征字的類型包括:生僻字和超綱字中至少一種;
獲取所述至少一個特征字各自對應的標識碼;
根據所述至少一個特征字各自對應的標識碼,確定所述至少一個特征字各自對應的釋義;
根據所述至少一個特征字,以及所述至少一個特征字各自對應的釋義,對所述至少一個特征字進行標注。
可選的,所述將工具書中包含的字和特征字庫中包含的特征字進行匹配之前,還包括:
定義N個特征字;
將所述N個特征字存儲至所述特征字庫中。
可選的,所述獲取所述至少一個特征字各自對應的標識碼之前,還包括:
根據所述特征字庫存儲所述N個特征字時生成的所述N個特征字各自對應的標識碼,確定第一映射關系,所述第一映射關系表征特征字和標識碼之間的對應關系;
所述獲取所述至少一個特征字各自對應的標識碼,包括:
根據所述至少一個特征字和所述第一映射關系,確定所述至少一個特征字各自對應的標識碼。
可選的,所述根據所述至少一個特征字各自對應的標識碼,確定所述至少一個特征字各自對應的釋義之前,還包括:
獲取所述N個特征字各自對應的釋義;
根據所述第一映射關系和所述N個特征字各自對應的釋義,確定第二映射關系,所述第二映射關系表征標識碼和釋義之間的對應關系;
所述根據所述至少一個特征字各自對應的標識碼,確定所述至少一個特征字各自對應的釋義,包括:
根據所述至少一個特征字各自對應的標識碼和所述第二映射關系,確定所述至少一個特征字各自對應的釋義。
可選的,所述根據所述至少一個特征字,以及所述至少一個特征字各自對應的釋義,對所述至少一個特征字進行標注,包括:
將所述至少一個特征字各自對應的釋義標注在對應特征字所在的頁面的頁腳處。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京北大方正電子有限公司,未經北大方正集團有限公司;北京北大方正電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010037229.8/2.html,轉載請聲明來源鉆瓜專利網。





