[發(fā)明專利]正則表達式的生成方法、裝置及計算機設(shè)備有效
| 申請?zhí)枺?/td> | 202110589829.X | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113268246B | 公開(公告)日: | 2022-05-13 |
| 發(fā)明(設(shè)計)人: | 劉一鵬 | 申請(專利權(quán))人: | 大箴(杭州)科技有限公司 |
| 主分類號: | G06F8/41 | 分類號: | G06F8/41 |
| 代理公司: | 北京中強智尚知識產(chǎn)權(quán)代理有限公司 11448 | 代理人: | 黃耀威;劉敏 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 正則 表達式 生成 方法 裝置 計算機 設(shè)備 | ||
本申請公開了一種正則表達式的生成方法、裝置及計算機設(shè)備,涉及計算機技術(shù)領(lǐng)域,可以解決目前正則表達式的生成效率低、準(zhǔn)確性不高的技術(shù)問題。其中方法包括:確定需要被正則表達式匹配的原始文本;將所述原始文本拆分為第一文本片段和第二文本片段,所述第一文本片段為與正則表達式生成規(guī)則匹配的預(yù)留文本片段,所述第二文本片段為需要替換為通配符的文本片段;依據(jù)預(yù)設(shè)替換規(guī)則將所述第二文本片段替換為目標(biāo)通配符;將所述第一文本片段以及所述目標(biāo)通配符按照所述原始文本中文本片段的排列順序進行合并,以生成所述原始文本的正則表達式。
技術(shù)領(lǐng)域
本申請涉及計算機技術(shù)領(lǐng)域,尤其涉及到一種正則表達式的生成方法、裝置及計算機設(shè)備。
背景技術(shù)
正則表達式為開發(fā)者提供了一種處理文本和解析文本的強大工具。通常被用來檢索或者替換符合預(yù)設(shè)模式或者規(guī)則的文本。在今天,許多程序設(shè)計語言都支持利用正則表達式進行字符串操作,正則表達式已成為各大編程語言和操作系統(tǒng)使用的主流工具。
然而現(xiàn)有的正則表達式開發(fā)過程中,需要用戶手動編寫大量代碼,且開發(fā)出來的正則表達式需要手動進行沖突驗證,進而導(dǎo)致正則表達式的生成效率較低、準(zhǔn)確性不高。
發(fā)明內(nèi)容
有鑒于此,本申請?zhí)峁┝艘环N正則表達式的生成方法、裝置及計算機設(shè)備,可用于解決目前正則表達式的生成效率低、準(zhǔn)確性不高的技術(shù)問題。
根據(jù)本申請的一個方面,提供了一種正則表達式的生成方法,該方法包括:
確定需要被正則表達式匹配的原始文本;
將所述原始文本拆分為第一文本片段和第二文本片段,所述第一文本片段為與正則表達式生成規(guī)則匹配的預(yù)留文本片段,所述第二文本片段為需要替換為通配符的文本片段;
依據(jù)預(yù)設(shè)替換規(guī)則將所述第二文本片段替換為目標(biāo)通配符;
將所述第一文本片段以及所述目標(biāo)通配符按照所述原始文本中文本片段的排列順序進行合并,以生成所述原始文本的正則表達式。
可選地,所述將所述原始文本拆分為第一文本片段和第二文本片段,具體包括:
基于分詞技術(shù)將所述原始文本切分為各個字符,并標(biāo)記所述各個字符在所述原始文本中的文本位置;
提取正則表達式生成規(guī)則中預(yù)留文本片段對應(yīng)的目標(biāo)文本位置;
確定對應(yīng)文本位置與所述目標(biāo)文本位置匹配的第一字符,以及對應(yīng)文本位置與所述目標(biāo)文本位置不匹配的第二字符,利用所述第一字符組建生成第一文本片段,利用所述第二字符組建生成待進行通配符替換的第二文本片段。
可選地,所述利用所述第二字符組建生成待進行通配符替換的第二文本片段,具體包括:
對所述第二字符進行字符識別,得到第一字符識別結(jié)果,所述第一字符識別結(jié)果至少包括所述第二字符的字符屬性、所述第二字符在所述原始文本中的字符位置;
基于所述第一字符識別結(jié)果將所述第二字符組建生成為至少一個第二文本片段,以使所述第二文本片段中的字符與預(yù)設(shè)字符屬性或預(yù)設(shè)字符屬性組合中的任意一個匹配。
可選地,所述依據(jù)預(yù)設(shè)替換規(guī)則將所述第二文本片段替換為目標(biāo)通配符,具體包括:
響應(yīng)于文本選定指令將所述第二文本片段調(diào)整為文本選定狀態(tài),在所述文本選定狀態(tài)下響應(yīng)于第一生成指令將所述第二文本片段替換為目標(biāo)通配符,所述第一生成指令是基于所述第二文本片段匹配的預(yù)設(shè)字符屬性或預(yù)設(shè)字符屬性組合發(fā)送的。
可選地,所述依據(jù)預(yù)設(shè)替換規(guī)則將所述第二文本片段替換為目標(biāo)通配符,具體包括:
確定所述第二文本片段對應(yīng)的目標(biāo)字符屬性或目標(biāo)字符屬性組合;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大箴(杭州)科技有限公司,未經(jīng)大箴(杭州)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110589829.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





