[發明專利]文本錄入方法及裝置在審
| 申請號: | 201811609497.1 | 申請日: | 2018-12-27 |
| 公開(公告)號: | CN109614598A | 公開(公告)日: | 2019-04-12 |
| 發明(設計)人: | 徐星宇 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 錄入 非文本信息 文本信息 目標文本 文本錄入 文本內容 策略提取 獲取目標 預設 文本 | ||
本公開提出一種文本錄入方法及裝置,其中,方法包括:獲取目標文本中的文本內容,并根據預設的提取策略提取文本內容中的文本信息和非文本信息;根據第一錄入策略錄入文本信息,并根據第二錄入策略錄入非文本信息,以實現對目標文本的錄入。該方法可以將目標文本的文本信息和非文本信息以相應錄入策略錄入,提高錄入的準確性,有效避免出現錄入錯誤的同時,提高錄入的適用性,有效提升錄入效率和錄入體驗,簡單易實現。
技術領域
本公開涉及文本處理技術領域,特別涉及一種文本錄入方法及裝置。
背景技術
相關技術,在對具有非文本信息的文本進行錄入時,錄入人員通常將文本中的文本信息和非文本信息分開進行錄入。
然而,以人工錄入方式對文本進行錄入時,容易出現錄入誤差,降低錄入的準確性,尤其是在錄入非文本信息時,一旦錄入人員對非文本信息的專業度不夠,不但會增加錄入時間,降低錄入效率,而且易造成錄入錯誤,導致錄入具有一定局限性,大大降低錄入的適用性,降低錄入體驗。
發明內容
本公開提供一種文本錄入方法及裝置,可以有效提高錄入的準確性,并在有效避免出現錄入錯誤的同時,提高錄入的適用性,有效提升錄入效率和錄入體驗,簡單易實現。
本公開第一方面實施例提出了一種文本錄入方法,包括以下步驟:獲取目標文本中的文本內容,并根據預設的提取策略提取所述文本內容中的文本信息和非文本信息;根據第一錄入策略錄入所述文本信息,并根據第二錄入策略錄入所述非文本信息,以實現對所述目標文本的錄入。
在本公開的一個實施例中,所述根據第二錄入策略錄入所述非文本信息,進一步包括:識別所述非文本信息的信息特征;根據所述信息特征獲取所述非文本信息的信息類型,以匹配所述第二錄入策略。
在本公開的一個實施例中,在識別所述非文本信息的信息特征之前,還包括:判斷所述文本內容是否存在所述非文本信息;如果存在所述非文本信息,則識別所述非文本信息的信息特征。
在本公開的一個實施例中,還包括:根據所述非文本信息的信息類型匹配第一展現策略;根據所述第一展現策略展現所述非文本信息。
在本公開的一個實施例中,還包括:根據第二展現策略展現所述文本信息。
本公開實施例的文本錄入方法,可以將目標文本的文本信息和非文本信息以相應錄入策略錄入,實現目標文本的錄入,從而可以有效提高錄入的準確性,并在有效避免出現錄入錯誤的同時,提高錄入的適用性,有效提升錄入效率和錄入體驗,簡單易實現。
為達上述目的,本公開第二方面實施例提出了一種文本錄入裝置,包括:獲取模塊,用于獲取目標文本中的文本內容,并根據預設的提取策略提取所述文本內容中的文本信息和非文本信息;錄入模塊,用于根據第一錄入策略錄入所述文本信息,并根據第二錄入策略錄入所述非文本信息,以實現對所述目標文本的錄入。
在本公開的一個實施例中,在本公開的一個實施例中,還包括:判斷模塊,用于在提取所述文本內容中的文本信息和非文本信息之前,判斷所述文本內容是否存在所述非文本信息,以在不存在所述非文本信息時,所述錄入模塊根據所述第一錄入策略錄入所述文本信息。
在本公開的一個實施例中,所述錄入模塊包括:識別單元,用于識別所述非文本信息的信息特征;匹配單元,用于根據所述信息特征獲取所述非文本信息的信息類型,以匹配所述第二錄入策略。
本公開實施例的文本錄入裝置,可以將目標文本的文本信息和非文本信息以相應錄入策略錄入,實現目標文本的錄入,從而可以有效提高錄入的準確性,并在有效避免出現錄入錯誤的同時,提高錄入的適用性,有效提升錄入效率和錄入體驗,簡單易實現。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811609497.1/2.html,轉載請聲明來源鉆瓜專利網。





