[發明專利]一種文本匹配方法、終端設備及存儲介質在審
| 申請號: | 202110375075.8 | 申請日: | 2021-04-08 |
| 公開(公告)號: | CN113076733A | 公開(公告)日: | 2021-07-06 |
| 發明(設計)人: | 劉晹;任勇;劉云;李煒;俞權林;黃義熾 | 申請(專利權)人: | 廈門市巨龍信息科技有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06K9/62 |
| 代理公司: | 廈門市精誠新創知識產權代理有限公司 35218 | 代理人: | 何家富 |
| 地址: | 361000 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文本 匹配 方法 終端設備 存儲 介質 | ||
1.一種文本匹配方法,其特征在于,包括以下步驟:
S1:根據文本匹配所需要的規則構建規則表達式集合,并定義和加載規則表達式集合中的規則表達式匹配時所需的外部資源;
S2:將規則表達式集合解析為樹結構,當樹結構中的節點中存儲的規則表達式需要與外部資源進行匹配時,該節點中還包含對應的外部資源接口,通過外部資源接口在進行規則表達式匹配時讀取外部資源;
S3:通過樹結構對待匹配文本進行文本匹配。
2.根據權利要求1所述的文本匹配方法,其特征在于:當外部資源的匹配需要通過至少兩個規則表達式進行匹配時,將用于該外部資源匹配的規則表達式集合解析為樹結構進行存儲,解析后的樹結構的節點在需要與外部資源進行匹配時包含用于連接外部資源的外部資源接口。
3.根據權利要求1所述的文本匹配方法,其特征在于:樹結構為前綴樹、AC自動機和有限狀態機中的一種。
4.根據權利要求1所述的文本匹配方法,其特征在于:外部資源包括外部統計信息、詞表和知識庫。
5.根據權利要求1所述的文本匹配方法,其特征在于:當待匹配文本有多個句子組成時,先將待匹配文本切分為句子后,將每個句子與分別與樹結構進行匹配,并對匹配后的結果進行去重處理。
6.一種文本匹配終端設備,其特征在于:包括處理器、存儲器以及存儲在所述存儲器中并在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現如權利要求1~5中任一所述方法的步驟。
7.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于:所述計算機程序被處理器執行時實現如權利要求1~5中任一所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門市巨龍信息科技有限公司,未經廈門市巨龍信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110375075.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種玻璃清洗機
- 下一篇:一種適用于火電機組循環水系統的調速系統





