[發(fā)明專利]數(shù)字提取方法和裝置、存儲介質(zhì)及電子裝置有效
| 申請?zhí)枺?/td> | 201810961840.2 | 申請日: | 2018-08-22 |
| 公開(公告)號: | CN109299439B | 公開(公告)日: | 2021-05-11 |
| 發(fā)明(設(shè)計)人: | 包恒耀 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F40/117 | 分類號: | G06F40/117;G06F40/12;G06F40/258;G06F40/284 |
| 代理公司: | 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 周婷婷;江舟 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)字 提取 方法 裝置 存儲 介質(zhì) 電子 | ||
本發(fā)明公開了一種數(shù)字提取方法和裝置、存儲介質(zhì)及電子裝置。其中,該方法包括:獲取與輸入的查詢指令相匹配的指令文本;對指令文本執(zhí)行分詞標(biāo)注處理,得到指令分詞集合,其中,指令分詞集合中的每一個指令分詞分別配置有詞性標(biāo)簽;根據(jù)詞性標(biāo)簽從指令分詞集合中確定出目標(biāo)指令分詞,其中,目標(biāo)指令分詞中包含有效數(shù)字信息;根據(jù)指令分詞集合中所包含的目標(biāo)指令分詞之間的位置關(guān)系,從指令文本中提取出與有效數(shù)字信息匹配的目標(biāo)數(shù)字,其中,目標(biāo)數(shù)字為允許機(jī)器識別的數(shù)字。本發(fā)明解決了相關(guān)技術(shù)中數(shù)字提取準(zhǔn)確性低的技術(shù)問題。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)領(lǐng)域,具體而言,涉及一種數(shù)字提取方法和裝置、存儲介質(zhì)及電子裝置。
背景技術(shù)
在用戶向硬件設(shè)備輸入的指令中,常常會攜帶一些數(shù)字信息,如包含用于表示貨幣、時間、長度、距離等數(shù)字詞語的信息。為了方便硬件設(shè)備對上述數(shù)字信息中所攜帶的數(shù)字執(zhí)行相應(yīng)的機(jī)器處理操作,往往需要先從指令中提取出上述數(shù)字。
目前,硬件設(shè)備在獲取到指令對應(yīng)的指令文本之后,常用的提取方式為:利用正則匹配公式對指令文本進(jìn)行簡單匹配,以提取出指令文本中數(shù)字信息所攜帶的數(shù)字。然而,在指令文本中常常會出現(xiàn)特殊數(shù)字,如無意義的漢字?jǐn)?shù)字或漢字?jǐn)?shù)字和阿拉伯?dāng)?shù)字被混合使用的復(fù)合數(shù)字。針對上述特殊數(shù)字,若繼續(xù)采用相關(guān)技術(shù)所采用的數(shù)字提取方法,將導(dǎo)致數(shù)字提取的準(zhǔn)確性低的問題。
針對上述的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種數(shù)字提取方法和裝置、存儲介質(zhì)及電子裝置,以至少解決相關(guān)技術(shù)中數(shù)字提取準(zhǔn)確性低的技術(shù)問題。
根據(jù)本發(fā)明實施例的一個方面,提供了一種數(shù)字提取方法,包括:獲取與輸入的查詢指令相匹配的指令文本;對上述指令文本執(zhí)行分詞標(biāo)注處理,得到指令分詞集合,其中,上述指令分詞集合中的每一個指令分詞分別配置有詞性標(biāo)簽;根據(jù)上述詞性標(biāo)簽從上述指令分詞集合中確定出目標(biāo)指令分詞,其中,上述目標(biāo)指令分詞中包含有效數(shù)字信息;根據(jù)上述指令分詞集合中所包含的上述目標(biāo)指令分詞之間的位置關(guān)系,從上述指令文本中提取出與上述有效數(shù)字信息匹配的目標(biāo)數(shù)字,其中,上述目標(biāo)數(shù)字為允許機(jī)器識別的數(shù)字。
根據(jù)本發(fā)明實施例的另一方面,還提供了一種數(shù)字提取裝置,包括:獲取單元,用于獲取與輸入的查詢指令相匹配的指令文本;處理單元,用于對上述指令文本執(zhí)行分詞標(biāo)注處理,得到指令分詞集合,其中,上述指令分詞集合中的每一個指令分詞分別配置有詞性標(biāo)簽;確定單元,用于根據(jù)上述詞性標(biāo)簽從上述指令分詞集合中確定出目標(biāo)指令分詞,其中,上述目標(biāo)指令分詞中包含有效數(shù)字信息;提取單元,用于根據(jù)上述指令分詞集合中所包含的上述目標(biāo)指令分詞之間的位置關(guān)系,從上述指令文本中提取出與上述有效數(shù)字信息匹配的目標(biāo)數(shù)字,其中,上述目標(biāo)數(shù)字為允許機(jī)器識別的數(shù)字。
作為一種可選的示例,上述提取單元包括:第三提取模塊,用于在上述獲取上述有效數(shù)字信息中所攜帶的數(shù)字的數(shù)字格式之后,在上述數(shù)字格式均為阿拉伯?dāng)?shù)字的情況下,提取上述有效數(shù)字信息所攜帶的數(shù)字,作為上述目標(biāo)數(shù)字。
作為一種可選的示例,上述確定單元包括:第三獲取模塊,用于從上述指令分詞集合中,獲取上述詞性標(biāo)簽指示為數(shù)詞的指令分詞,作為上述目標(biāo)指令分詞,其中,上述詞性標(biāo)簽指示為數(shù)詞的指令分詞中包含上述有效數(shù)字信息。
作為一種可選的示例,上述獲取單元包括以下至少之一:第四獲取模塊,用于獲取語音輸入的上述查詢指令;識別上述查詢指令中所攜帶的指令信息;根據(jù)上述指令信息生成上述指令文本;第五獲取模塊,用于獲取通過輸入設(shè)備輸入的上述查詢指令;解析上述查詢指令,得到上述指令文本。
根據(jù)本發(fā)明實施例的又一方面,還提供了一種存儲介質(zhì),該存儲介質(zhì)中存儲有計算機(jī)程序,其中,該計算機(jī)程序被設(shè)置為運(yùn)行時執(zhí)行上述數(shù)字提取方法。
根據(jù)本發(fā)明實施例的又一方面,還提供了一種電子裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計算機(jī)程序,其中,上述處理器通過計算機(jī)程序執(zhí)行上述的數(shù)字提取方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810961840.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





