[發明專利]生成正則表達式的方法、裝置、計算設備及存儲介質在審
| 申請號: | 202110779337.7 | 申請日: | 2021-07-09 |
| 公開(公告)號: | CN113656538A | 公開(公告)日: | 2021-11-16 |
| 發明(設計)人: | 馬英峰;馮政元;馮冉;劉富強 | 申請(專利權)人: | 深圳價值在線信息科技股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/338;G06F16/36;G06F40/289 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 梁立耀 |
| 地址: | 518000 廣東省深圳市福田區沙頭街道*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 生成 正則 表達式 方法 裝置 計算 設備 存儲 介質 | ||
本申請適用于計算機技術領域,提供一種生成正則表達式的方法、裝置、計算設備及存儲介質,所述方法包括:獲取文本內容;對所述文本內容進行分詞,得到分詞結果;根據所述分詞結果在預設數據庫中搜索,獲得搜索結果;若所述搜索結果滿足預設條件,則輸出與所述搜索結果對應的正則表達式;若所述搜索結果不滿足預設條件,則根據所述分詞結果生成正則表達式并輸出。本申請的實施例能降低獲取正則表達式的成本。
技術領域
本申請屬于計算機技術領域,尤其涉及一種生成正則表達式的方法、裝置、計算設備及存儲介質。
背景技術
正則表達式為程序代碼,通常被用來檢索、替換那些符合某個模式(規則)的文本。用戶通常采用搜索引擎搜索代碼片段的方式獲取成品的正則表達式,這些存在于網絡的代碼片段不僅分散且可靠性差,導致用戶獲取正則表達式的成本很高。
發明內容
本申請的實施例提供一種生成正則表達式的方法、裝置、計算設備及存儲介質,能降低獲取正則表達式的成本。
第一方面,本申請的實施例提供一種生成正則表達式的方法,應用于服務器,所述方法包括:
獲取文本內容;
對所述文本內容進行分詞,得到分詞結果;
根據所述分詞結果在預設數據庫中搜索,獲得搜索結果;
若所述搜索結果滿足預設條件,則輸出與所述搜索結果對應的正則表達式;
若所述搜索結果不滿足預設條件,則根據所述分詞結果生成正則表達式并輸出。
在第一方面的一種可能的實現方式中,所述根據所述分詞結果在預設數據庫中搜索,獲得搜索結果,包括:
從所述分詞結果提取關鍵字;
根據所述關鍵字在預設數據庫中搜索,獲得搜索結果。
在第一方面的一種可能的實現方式中,所述從所述分詞結果提取關鍵字,包括:
將所述分詞結果與預設詞庫進行比對,得到比對結果;
根據所述比對結果確定關鍵字。
在第一方面的一種可能的實現方式中,所述若所述搜索結果滿足預設條件,則輸出與所述搜索結果對應的正則表達式,包括:
計算所述搜索結果的權重;
若所述權重大于設定值,則輸出與所述搜索結果對應的正則表達式。
在第一方面的一種可能的實現方式中,所述預設數據庫包括第一文檔和第二文檔;
相應的,所述根據所述關鍵字在預設數據庫中搜索,獲得搜索結果,包括:
將所述關鍵字與所述第一文檔的數據進行匹配,得到搜索結果;
相應的,所述若所述權重大于設定值,則輸出與所述搜索結果對應的正則表達式,包括:
若所述權重大于設定值,則從所述第二文檔選取與所述搜索結果對應的正則表達式并輸出。
在第一方面的一種可能的實現方式中,所述根據所述分詞結果生成正則表達式并輸出,包括:
根據所述分詞結果在所述預設數據庫中搜索,獲得多個代碼片段;
根據所述多個代碼片段生成正則表達式并輸出。
在第一方面的一種可能的實現方式中,所述獲取文本內容,包括:
接收描述信息;
從所述描述信息提取文本內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳價值在線信息科技股份有限公司,未經深圳價值在線信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110779337.7/2.html,轉載請聲明來源鉆瓜專利網。





