[發(fā)明專利]一種正則表達式的擴充方法及裝置在審
| 申請?zhí)枺?/td> | 201910325709.1 | 申請日: | 2019-04-22 |
| 公開(公告)號: | CN111831865A | 公開(公告)日: | 2020-10-27 |
| 發(fā)明(設計)人: | 魏譽熒 | 申請(專利權(quán))人: | 廣東小天才科技有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06F16/33 |
| 代理公司: | 上海碩力知識產(chǎn)權(quán)代理事務所(普通合伙) 31251 | 代理人: | 郭桂峰 |
| 地址: | 523851 廣東省東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 正則 表達式 擴充 方法 裝置 | ||
本發(fā)明屬于語義解析領(lǐng)域,公開了一種正則表達式的擴充方法及裝置,其方法包括:獲取用戶語料,生成第一文本;對第一文本進行語義解析,得到對應的語義;根據(jù)第一文本的語義對第一文本進行變換,生成組合不同且與第一文本語義相同的第二文本;根據(jù)第二文本生成正則表達式。本發(fā)明提供的一種正則表達式的擴充方法及裝置具有的有益效果為:本發(fā)明通過對使用過程中獲取的文本進行變換生成新的文本,然后根據(jù)新的文本生成正則表達式,可擴充已有的正則表達式庫,使構(gòu)建的正則表達式庫更完善,以便準確地理解用戶的意圖,提高語義解析的成功率,并作出相應的反應,提高用戶的使用體驗。
技術(shù)領(lǐng)域
本發(fā)明屬于語義解析領(lǐng)域,特別涉及一種正則表達式的擴充方法及裝置。
背景技術(shù)
隨著智能終端及網(wǎng)絡技術(shù)的迅速發(fā)展,人們越來越習慣地使用智能終端完成各種需求。在人機交互場景中,語義解析是必不可少的一個環(huán)節(jié),其主要通過分析用戶輸入的語音,了解用戶的意圖,并轉(zhuǎn)換成機器能夠理解的結(jié)構(gòu)化數(shù)據(jù)格式。
在人工智能的語義解析領(lǐng)域,對用戶的語料,主要使用預設的規(guī)則串與語音轉(zhuǎn)換后的文本串進行字符串匹配的方法來對語義進行解析。其中,預設的規(guī)則串可為正則表達式,即通過正則表達式來完成語義的解析。目前,正則表達式的編寫主要通過收集大量語料,然后對大量語料進行分詞、句式分析等方法來生成。由于中文句式數(shù)量較多,在編寫正則表達式時,可能存在有些句式的語料未被收集到,使得構(gòu)建的正則表達式庫不完全,導致用戶在使用時一些語料無法被正常解析,進而導致機器無法準確地理解用戶的意圖,并做出相應的反應,降低用戶的使用體驗。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種正則表達式的擴充方法及裝置,通過對接收的用戶語料進行句式轉(zhuǎn)換,并生成新的正則表達式,以擴充正則表達式庫,進而提高語義解析的準確率。
本發(fā)明提供的技術(shù)方案如下:
一方面,提供一種正則表達式的擴充方法,包括:
獲取用戶語料,生成第一文本;
對所述第一文本進行語義解析,得到對應的語義;
根據(jù)所述第一文本的語義對所述第一文本進行變換,生成組合不同且與所述第一文本語義相同的第二文本;
根據(jù)所述第二文本生成正則表達式。
進一步優(yōu)選地,所述第一文本的語義對所述第一文本進行變換,生成組合不同且與所述第一文本語義相同的第二文本具體包括:
根據(jù)所述第一文本的語義對所述第一文本進行語法分析,提取所述第一文本中的多個關(guān)鍵詞和表示所述關(guān)鍵詞之間的關(guān)系的關(guān)系詞;
變換所述關(guān)鍵詞之間的組合順序;
根據(jù)所述關(guān)系詞,確定變換前所述關(guān)鍵詞之間的關(guān)系;
根據(jù)變換前所述關(guān)鍵詞之間的關(guān)系,確定變換組合順序后所述關(guān)鍵詞之間的新關(guān)系詞;
根據(jù)所述關(guān)鍵詞變換后的組合順序以及所述新關(guān)系詞,生成組合不同且與所述第一文本語義相同的第二文本。
進一步優(yōu)選地,所述第一文本的語義對所述第一文本進行變換,生成句式的第二文本具體包括:
根據(jù)所述第一文本的語義對所述第一文本進行語法分析,提取所述第一文本中的多個關(guān)鍵詞和連接詞;
變換所述關(guān)鍵詞之間的組合順序,并變換所述連接詞,生成組合不同且與所述第一文本語義相同的第二文本。
進一步優(yōu)選地,所述根據(jù)所述第二文本生成正則表達式具體包括:
獲取所述關(guān)鍵詞的語義槽;
獲取所述關(guān)系詞的語義槽;
根據(jù)所述關(guān)鍵詞的語義槽和所述關(guān)系詞的語義槽,生成正則表達式。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東小天才科技有限公司,未經(jīng)廣東小天才科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910325709.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





