[發(fā)明專利]一種應(yīng)用程序中數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910778784.3 | 申請(qǐng)日: | 2019-08-22 |
| 公開(公告)號(hào): | CN110647987A | 公開(公告)日: | 2020-01-03 |
| 發(fā)明(設(shè)計(jì))人: | 李正興 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06F16/33;G06F16/36;G06K9/62;G06N3/04 |
| 代理公司: | 44202 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人: | 郝傳鑫;賈允 |
| 地址: | 518057 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 糾錯(cuò)數(shù)據(jù) 實(shí)體集合 目標(biāo)實(shí)體 應(yīng)用程序 實(shí)體庫 編輯距離 存儲(chǔ)介質(zhì) 電子設(shè)備 后續(xù)數(shù)據(jù) 糾錯(cuò)處理 匹配關(guān)系 實(shí)體識(shí)別 數(shù)據(jù)糾錯(cuò) 相似程度 意圖識(shí)別 準(zhǔn)確率 分詞 糾錯(cuò) 預(yù)設(shè) 申請(qǐng) | ||
本申請(qǐng)公開了一種應(yīng)用程序中數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),該方法包括:基于實(shí)體識(shí)別模型和意圖識(shí)別模型對(duì)待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體和意圖的識(shí)別,得到預(yù)選實(shí)體和預(yù)選意圖,若預(yù)選實(shí)體與預(yù)選意圖對(duì)應(yīng)的意圖模板中子模板中的實(shí)體不存在匹配關(guān)系,對(duì)待識(shí)別數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù),根據(jù)應(yīng)用程序的實(shí)體庫和預(yù)設(shè)編輯距離確定待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合;實(shí)體集合中的每個(gè)實(shí)體為實(shí)體庫中的實(shí)體,基于待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中每個(gè)實(shí)體和待糾錯(cuò)數(shù)據(jù)之間的相似程度值從實(shí)體集合中確定出用于糾錯(cuò)的目標(biāo)實(shí)體,基于目標(biāo)實(shí)體對(duì)待識(shí)別數(shù)據(jù)進(jìn)行糾錯(cuò)處理。如此,通過對(duì)待識(shí)別數(shù)據(jù)預(yù)先進(jìn)行數(shù)據(jù)糾錯(cuò)處理,可以提高后續(xù)數(shù)據(jù)識(shí)別處理的準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請(qǐng)涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種應(yīng)用程序中數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
當(dāng)今,各個(gè)領(lǐng)域的數(shù)據(jù)正處于飛速增長(zhǎng)中,由此導(dǎo)致數(shù)據(jù)處理技術(shù)領(lǐng)域的發(fā)展越來越迅速。一般的,數(shù)據(jù)處理的過程為:設(shè)備根據(jù)接收到的待識(shí)別數(shù)據(jù),對(duì)該待識(shí)別數(shù)據(jù)中的實(shí)體進(jìn)行識(shí)別,并對(duì)識(shí)別結(jié)果進(jìn)行處理,以確定該數(shù)據(jù)對(duì)應(yīng)的輸出。這種數(shù)據(jù)處理的方式可以被應(yīng)用在語言識(shí)別,人機(jī)交互等各種領(lǐng)域。
上述描述中,實(shí)體是指具有具體而真實(shí)的形態(tài)或者結(jié)構(gòu)的事物,能夠?yàn)槿藗兯兄c親手接觸。從數(shù)據(jù)處理的角度看,現(xiàn)實(shí)世界中的客觀事物稱為實(shí)體,它是現(xiàn)實(shí)世界中任何可區(qū)分,可識(shí)別的事物。然而,由于設(shè)備接收的待識(shí)別數(shù)據(jù)本身可能存在某些錯(cuò)誤,比如,用戶在輸入過程中輸錯(cuò)某些實(shí)體中的字或者詞。如果設(shè)備直接對(duì)有錯(cuò)誤的待識(shí)別數(shù)據(jù)進(jìn)行識(shí)別,則可能對(duì)最終結(jié)果產(chǎn)生較大的負(fù)面影響,基于此,設(shè)備需要在對(duì)待識(shí)別數(shù)據(jù)進(jìn)行識(shí)別處理之前,進(jìn)行數(shù)據(jù)糾錯(cuò)處理。
本申請(qǐng)實(shí)施例提供一種應(yīng)用程序中數(shù)據(jù)的處理方法,通過對(duì)待識(shí)別數(shù)據(jù)預(yù)先進(jìn)行數(shù)據(jù)糾錯(cuò)處理,可以提高后續(xù)數(shù)據(jù)識(shí)別處理的識(shí)別準(zhǔn)確率。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種應(yīng)用程序中數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),通過對(duì)待識(shí)別數(shù)據(jù)預(yù)先進(jìn)行數(shù)據(jù)糾錯(cuò)處理,可以提高后續(xù)數(shù)據(jù)識(shí)別處理的識(shí)別準(zhǔn)確率。
一方面,本申請(qǐng)實(shí)施例提供了一種應(yīng)用程序中數(shù)據(jù)的處理方法,該方法包括:
基于實(shí)體識(shí)別模型和意圖識(shí)別模型對(duì)待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體和意圖的識(shí)別,得到預(yù)選實(shí)體和預(yù)選意圖;
若預(yù)選實(shí)體與預(yù)選意圖對(duì)應(yīng)的意圖模板中子模板中的實(shí)體不存在匹配關(guān)系,對(duì)待識(shí)別數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù);
根據(jù)應(yīng)用程序的實(shí)體庫和預(yù)設(shè)編輯距離確定待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合;實(shí)體集合中的每個(gè)實(shí)體為實(shí)體庫中的實(shí)體;
基于待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中每個(gè)實(shí)體和待糾錯(cuò)數(shù)據(jù)之間的相似程度值從實(shí)體集合中確定出用于糾錯(cuò)的目標(biāo)實(shí)體;
基于目標(biāo)實(shí)體對(duì)待識(shí)別數(shù)據(jù)進(jìn)行糾錯(cuò)處理。
另一方面提供了一種應(yīng)用程序中數(shù)據(jù)的處理裝置,該裝置包括:
識(shí)別模塊,用于基于實(shí)體識(shí)別模型和意圖識(shí)別模型對(duì)待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體和意圖的識(shí)別,得到預(yù)選實(shí)體和預(yù)選意圖;
分詞模塊,用于若預(yù)選實(shí)體與預(yù)選意圖對(duì)應(yīng)的意圖模板中子模板中的實(shí)體不存在匹配關(guān)系,對(duì)待識(shí)別數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù);
第一確定模塊,用于根據(jù)應(yīng)用程序的實(shí)體庫和預(yù)設(shè)編輯距離確定待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合;實(shí)體集合中的每個(gè)實(shí)體為實(shí)體庫中的實(shí)體;
第二確定模塊,用于基于待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中每個(gè)實(shí)體和待糾錯(cuò)數(shù)據(jù)之間的相似程度值從實(shí)體集合中確定出用于糾錯(cuò)的目標(biāo)實(shí)體;
處理模塊,用于基于目標(biāo)實(shí)體對(duì)待識(shí)別數(shù)據(jù)進(jìn)行糾錯(cuò)處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910778784.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 快閃存儲(chǔ)器控制器、其糾錯(cuò)碼控制器及其方法和系統(tǒng)
- 數(shù)據(jù)記錄再現(xiàn)裝置和數(shù)據(jù)庫裝置
- 解碼器、接收裝置及其解碼方法
- 數(shù)據(jù)糾錯(cuò)方法及裝置
- 一種數(shù)據(jù)糾錯(cuò)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 一種固態(tài)硬盤糾錯(cuò)方法、裝置、存儲(chǔ)設(shè)備及存儲(chǔ)介質(zhì)
- 基于AI深度學(xué)習(xí)的人力資源數(shù)據(jù)處理系統(tǒng)及方法
- 一種數(shù)據(jù)糾錯(cuò)方法、系統(tǒng)、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種量子密鑰分發(fā)系統(tǒng)的糾錯(cuò)方法及裝置
- 實(shí)體集合擴(kuò)展方法
- 基于人工智能的實(shí)體語義檢索處理方法及裝置
- 一種創(chuàng)建知識(shí)圖譜的方法及裝置
- 實(shí)體推薦方法和裝置
- 實(shí)體標(biāo)注數(shù)據(jù)集構(gòu)建方法、裝置及設(shè)備
- 用于查詢信息的方法和裝置
- 一種確定文本新穎度的方法及相關(guān)裝置
- 實(shí)體關(guān)系分析方法、裝置、分析設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 搜索由分布式數(shù)據(jù)源維護(hù)的數(shù)據(jù)結(jié)構(gòu)
- 一種實(shí)體識(shí)別方法、計(jì)算設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種相關(guān)實(shí)體確定方法、裝置及計(jì)算設(shè)備
- 信息查詢方法及裝置
- 一種實(shí)體嵌入方法及裝置
- 一種實(shí)體嵌入方法、裝置、介質(zhì)及設(shè)備
- 實(shí)體確定方法、裝置及存儲(chǔ)介質(zhì)
- 核心實(shí)體確定方法及其系統(tǒng)、服務(wù)器和計(jì)算機(jī)可讀介質(zhì)
- 文本的實(shí)體識(shí)別方法、設(shè)備及存儲(chǔ)介質(zhì)
- 資源分配方法、裝置、可讀存儲(chǔ)介質(zhì)和電子設(shè)備
- 實(shí)體對(duì)齊方法、裝置、計(jì)算機(jī)可讀介質(zhì)及電子設(shè)備
- 實(shí)體關(guān)系抽取方法、實(shí)體關(guān)系學(xué)習(xí)模型的獲取方法及設(shè)備
- 對(duì)虛擬化應(yīng)用程序的基于策略的訪問
- 應(yīng)用程序執(zhí)行、應(yīng)用程序提供裝置和應(yīng)用程序分發(fā)方法
- 一種軟件保護(hù)方法、裝置及系統(tǒng)
- 應(yīng)用程序的開發(fā)方法和系統(tǒng)
- 應(yīng)用程序的擴(kuò)展方法及裝置
- 一種應(yīng)用程序商店的應(yīng)用程序發(fā)布方法及裝置
- 一種應(yīng)用程序的監(jiān)控方法、裝置及系統(tǒng)
- 用于對(duì)虛擬化應(yīng)用程序的基于策略的訪問的方法和系統(tǒng)
- 應(yīng)用程序控制方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種應(yīng)用程序安裝、卸載方法及通信終端





