[發(fā)明專利]一種基于正則表達式的匹配方法及裝置有效
| 申請?zhí)枺?/td> | 201610654109.6 | 申請日: | 2016-08-11 |
| 公開(公告)號: | CN106326363B | 公開(公告)日: | 2019-09-17 |
| 發(fā)明(設(shè)計)人: | 陳娜娜 | 申請(專利權(quán))人: | 海信集團有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 266100 山*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 正則表達式 匹配 數(shù)據(jù)庫 靈活度 詞性 語法結(jié)構(gòu) 匹配項 分類 語句 過濾 集合 | ||
本發(fā)明公開了一種基于正則表達式的匹配方法及裝置,用于解決當(dāng)需要過濾很復(fù)雜的語句時,需要編寫多個復(fù)雜的正則表達式進行匹配,正則表達式生成難度大,匹配靈活度低的問題。確定正則表達式集合對應(yīng)的數(shù)據(jù)庫;將數(shù)據(jù)庫中的字,按照詞性分類,得到至少一種類型的字;根據(jù)語法結(jié)構(gòu),將每種類型的字中任意兩個或兩個以上的字組成詞;將數(shù)據(jù)庫中的詞和所組成的詞,按照詞性分類,得到至少一種類型的詞;將至少一種類型的字、至少一種類型的詞,和/或至少一個用于匹配任意字符的特定符號作為正則表達式的匹配項,形成至少一個正則表達式。按上述步驟生成正則表達式,不需要逐個編寫多個復(fù)雜的正則表達式,降低了正則表達式生成的難度,提高了匹配的靈活度。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機領(lǐng)域,尤其涉及一種基于正則表達式的匹配方法及裝置。
背景技術(shù)
一些業(yè)務(wù)處理過程中,例如,語音通話業(yè)務(wù)、短信業(yè)務(wù)等,需要對文本語句進行精確的過濾時,可以使用正則表達式與文本語句進行匹配。在現(xiàn)有技術(shù)中,在對于復(fù)雜的文本語句進行匹配之前,需要編寫一條與該復(fù)雜的文本語句完全匹配的正則表達式,或者編寫多條正則表達式與該復(fù)雜的文本語句進行多次匹配,難度和復(fù)雜度很高。
因此,當(dāng)對復(fù)雜的文本語句進行過濾時,采用現(xiàn)有技術(shù)的方法編寫正則表達式生成難度大,匹配靈活度低。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于正則表達式的匹配方法及裝置,以解決當(dāng)需要過濾很復(fù)雜的語句時,需要編寫多個復(fù)雜的正則表達式進行匹配,正則表達式生成難度大,匹配靈活度低的問題。
本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的:
一種基于正則表達式的匹配方法,該方法包括:
根據(jù)待匹配語句所屬的業(yè)務(wù)類型,確定與所述業(yè)務(wù)類型對應(yīng)的正則表達式集合;
將所述待匹配語句與所述正則表達式集合中的正則表達式進行匹配,得到匹配后的語句;
其中,所述正則表達式集合中的正則表達式是按照如下步驟生成的:
確定所述正則表達式集合所屬的業(yè)務(wù)類型對應(yīng)的數(shù)據(jù)庫;
將所述數(shù)據(jù)庫中的字,按照詞性進行分類,得到至少一種類型的字;
對于每種類型的字,根據(jù)語法結(jié)構(gòu),將該類型中的任意兩個或兩個以上的字組成詞;
將所述數(shù)據(jù)庫中的詞和所組成的詞,按照詞性進行分類,得到至少一種類型的詞;
將至少一種類型的字、至少一種類型的詞,和/或至少一個用于匹配任意字符的特定符號分別作為正則表達式的匹配項,并根據(jù)語法結(jié)構(gòu),將所述匹配項進行排序,形成至少一個正則表達式。
可選的,將所述待匹配語句與所述正則表達式集合中的正則表達式進行匹配,得到匹配后的語句,包括:
將所述待匹配語句與所述正則表達式集合中的正則表達式中的每個匹配項進行匹配;
若所述待匹配語句與任一正則表達式的每個匹配項均匹配成功,且所述任一正則表達式的每個匹配項在所述待匹配語句中的排列順序與在所述任一正則表達式中的排列順序一致,根據(jù)所述任一正則表達式,確定匹配后的語句,其中,所述匹配后的語句包括所述待匹配語句中與所述任一表達式中的匹配項匹配的字符。
可選的,所述根據(jù)所述任一正則表達式,確定匹配后的語句,包括:
確定所述任一正則表達式中的特定符號在所述任一正則表達式中的位置;
根據(jù)所述特定符號的編號,確定所述任一正則表達式中所述特定符號相鄰的匹配項的位置;
根據(jù)所述特定符號相鄰的匹配項的編號,確定所述待匹配語句中與所述特定符號相鄰的匹配項匹配的字符的位置;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于海信集團有限公司,未經(jīng)海信集團有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610654109.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)庫
- 數(shù)據(jù)庫管理系統(tǒng)及數(shù)據(jù)庫
- 數(shù)據(jù)庫構(gòu)筑裝置、數(shù)據(jù)庫檢索裝置、數(shù)據(jù)庫裝置、數(shù)據(jù)庫構(gòu)筑方法、以及數(shù)據(jù)庫檢索方法
- 數(shù)據(jù)庫和數(shù)據(jù)庫處理方法
- 數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫更新方法、數(shù)據(jù)庫以及數(shù)據(jù)庫更新程序
- 容器數(shù)據(jù)庫
- 數(shù)據(jù)庫同步方法及數(shù)據(jù)庫
- 一種MongoDB數(shù)據(jù)庫對象復(fù)制延遲監(jiān)控方法和裝置
- 數(shù)據(jù)分布式存儲方法、裝置、電子設(shè)備及存儲介質(zhì)
- 數(shù)據(jù)庫語句執(zhí)行方法及裝置





