[發明專利]字串解析方法、系統及電子設備有效
| 申請號: | 202011611793.2 | 申請日: | 2020-12-30 | 
| 公開(公告)號: | CN112631603B | 公開(公告)日: | 2022-04-08 | 
| 發明(設計)人: | 林懷謙;郭云輝;陳海燕;黃正文 | 申請(專利權)人: | 文思海輝智科科技有限公司 | 
| 主分類號: | G06F8/41 | 分類號: | G06F8/41 | 
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 安衛靜 | 
| 地址: | 102200 北京市昌平區未來科*** | 國省代碼: | 北京;11 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 字串 解析 方法 系統 電子設備 | ||
本發明提供了一種字串解析方法、系統及電子設備,涉及字串提取解析領域,該方法首先基于源文件的類型獲取待譯內容,并獲取待譯內容中包括的至少一個字串;然后針對一個字串中的每一字串,基于該字串的字串類型,從解析器隊列確定出與字串類型對應的目標解析器,使用目標解析器對該字串進行解析操作;將與該字串對應的句段標簽字串以及內容字串作為解析結果;最后得到與源文件對應的至少一個解析結果。該方法從預設的解析器隊列中獲取子串的目標解析器,并通過該目標解析器將包含代碼內容的字串進行屏蔽,能夠滿足任意文件類型的字串進行提取,解決了現有技術中在對含有代碼內容的文件解析時存在的支持類型有限且解析效果差的問題。
技術領域
本發明涉及字串提取解析技術領域,尤其是涉及一種字串解析方法、系統及電子設備。
背景技術
軟件工程中,用戶文檔會包含代碼內容,例如代碼示例;字串文件中亦還有代碼內容,尤其對于容器類文件格式(如xlsx、xliff、json)來說,其中包含的代碼字串類型更為復雜多變。翻譯這些文件時,需要識別這些代碼內容,提取普通文本。現有技術中的CAT工具雖然具有對代碼內容進行二次解析的功能,但不能滿足任意類型的文件解析,且解析器的種類較少,字串解析的效果較差。
發明內容
有鑒于此,本發明的目的在于提供一種字串解析方法、系統及電子設備,通過預設解析器隊列中獲取子串的目標解析器,并通過該目標解析器將包含代碼內容的字串進行屏蔽,能夠滿足任意文件類型的字串進行提取,解決了現有技術中在對含有代碼內容的文件解析時存在的支持類型有限且解析效果差的問題。
第一方面,本發明實施例提供了一種字串解析方法,該方法包括:
基于源文件的類型獲取待譯內容;
獲取待譯內容中包括的至少一個字串;
針對至少一個字串中的每一字串,基于該字串的字串類型,從解析器隊列確定出與字串類型對應的目標解析器,使用目標解析器對該字串進行解析操作;將與該字串對應的句段標簽字串以及內容字串作為解析結果;
得到與源文件對應的至少一個解析結果。
在一些實施方式中,針對至少一個字串中的每一字串,基于該字串的字串類型,從解析器隊列確定出與字串類型對應的目標解析器,包括:
獲取解析器隊列;其中,解析器隊列中包括至少一個目標解析器,每個目標解析器包含于字串類型對應的字串解析規則;字串解析規則用于獲取字串的句段標簽字串以及內容字串;
根據字串中的每一個字串的類型,遍歷解析器隊列中所有的目標解析器,從解析器隊列中確定與字串的類型對應的目標解析器。
在一些實施方式中,使用目標解析器對該字串進行解析操作,包括:
根據解析器隊列中的目標解析器的排列順序,確定目標解析器的執行順序;
將字串輸入至解析器隊列中第一執行順序的目標解析器中進行解析,得到第一解析結果;
將第一解析結果輸入至解析器隊列中第二執行順序的目標解析器中進行解析,并按照目標解析器的執行順序依次進行解析,直至解析器隊列中所有的目標解析器完成解析。
在一些實施方式中,將與該字串對應的句段標簽字串以及內容字串作為解析結果之后,還包括:
根據預設的探測規則對解析結果進行探測,得到目標解析器的探測結果;其中,探測規則用于探測解析器是否可用;
若目標解析器的探測結果不滿足探測規則,停止解析器的解析,并將輸入至目標解析器的字串作為解析結果。
在一些實施方式中,在使用目標解析器對該字串進行解析操作的過程中,目標解析器的解析異常時,方法包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于文思海輝智科科技有限公司,未經文思海輝智科科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011611793.2/2.html,轉載請聲明來源鉆瓜專利網。





