[發(fā)明專利]一種應(yīng)用程序中數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201910778784.3 | 申請(qǐng)日: | 2019-08-22 |
| 公開(kāi)(公告)號(hào): | CN110647987A | 公開(kāi)(公告)日: | 2020-01-03 |
| 發(fā)明(設(shè)計(jì))人: | 李正興 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06F16/33;G06F16/36;G06K9/62;G06N3/04 |
| 代理公司: | 44202 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人: | 郝傳鑫;賈允 |
| 地址: | 518057 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 糾錯(cuò)數(shù)據(jù) 實(shí)體集合 目標(biāo)實(shí)體 應(yīng)用程序 實(shí)體庫(kù) 編輯距離 存儲(chǔ)介質(zhì) 電子設(shè)備 后續(xù)數(shù)據(jù) 糾錯(cuò)處理 匹配關(guān)系 實(shí)體識(shí)別 數(shù)據(jù)糾錯(cuò) 相似程度 意圖識(shí)別 準(zhǔn)確率 分詞 糾錯(cuò) 預(yù)設(shè) 申請(qǐng) | ||
1.一種應(yīng)用程序中數(shù)據(jù)的處理方法,其特征在于,所述方法包括:
基于實(shí)體識(shí)別模型和意圖識(shí)別模型對(duì)待識(shí)別數(shù)據(jù)進(jìn)行實(shí)體和意圖的識(shí)別,得到預(yù)選實(shí)體和預(yù)選意圖;
若所述預(yù)選實(shí)體與所述預(yù)選意圖對(duì)應(yīng)的意圖模板中子模板中的實(shí)體不存在匹配關(guān)系,對(duì)所述待識(shí)別數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù);
根據(jù)應(yīng)用程序的實(shí)體庫(kù)和預(yù)設(shè)編輯距離確定所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合;所述實(shí)體集合中的每個(gè)實(shí)體為所述實(shí)體庫(kù)中的實(shí)體;
基于所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中每個(gè)實(shí)體和所述待糾錯(cuò)數(shù)據(jù)之間的相似程度值從所述實(shí)體集合中確定出用于糾錯(cuò)的目標(biāo)實(shí)體;
基于所述目標(biāo)實(shí)體對(duì)所述待識(shí)別數(shù)據(jù)進(jìn)行糾錯(cuò)處理。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述若所述預(yù)選實(shí)體與所述預(yù)選意圖對(duì)應(yīng)的意圖模板中子模板中的實(shí)體不存在匹配關(guān)系,對(duì)所述待識(shí)別數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù),包括:
若所述預(yù)選實(shí)體的實(shí)體類型與所述意圖模板中任一子模板中的實(shí)體的實(shí)體類型不存在匹配關(guān)系,對(duì)所述待識(shí)別數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述若所述預(yù)選實(shí)體與所述預(yù)選意圖對(duì)應(yīng)的意圖模板中子模板中的實(shí)體不存在匹配關(guān)系,對(duì)所述待識(shí)別數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù),包括:
若所述預(yù)選實(shí)體的的實(shí)體數(shù)量和所述意圖模板中的上限子模板中的實(shí)體的實(shí)體數(shù)量不存在匹配關(guān)系,對(duì)所述待識(shí)別數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù);
其中,所述上限子模板為所述意圖模板的所有子模板中,包含的實(shí)體的實(shí)體數(shù)量最多的子模板。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述待識(shí)別數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù),包括:
若所述預(yù)選實(shí)體和所述應(yīng)用程序?qū)嶓w庫(kù)中的實(shí)體相匹配,對(duì)所述待識(shí)別數(shù)據(jù)中除所述預(yù)選實(shí)體之外的數(shù)據(jù)進(jìn)行分詞操作,得到待糾錯(cuò)數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中每個(gè)實(shí)體和所述待糾錯(cuò)數(shù)據(jù)之間的相似程度值從所述實(shí)體集合中確定出用于糾錯(cuò)的目標(biāo)實(shí)體,基于所述目標(biāo)實(shí)體對(duì)所述待識(shí)別數(shù)據(jù)進(jìn)行糾錯(cuò)處理,包括:
確定所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中每個(gè)實(shí)體和所述待糾錯(cuò)數(shù)據(jù)的實(shí)體相似程度值;
確定所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中每個(gè)實(shí)體和所述待糾錯(cuò)數(shù)據(jù)的編輯相似程度值;
根據(jù)所述實(shí)體相似程度值和編輯相似程度值確定所述實(shí)體集合中每個(gè)實(shí)體和所述待糾錯(cuò)數(shù)據(jù)之間的相似程度值;
將最大相似程序值對(duì)應(yīng)的實(shí)體確定為所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的所述目標(biāo)實(shí)體;
使用所述目標(biāo)實(shí)體替換所述待識(shí)別數(shù)據(jù)中的所述待糾錯(cuò)數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中每個(gè)實(shí)體和所述待糾錯(cuò)數(shù)據(jù)之間的相似程度值從所述實(shí)體集合中確定出用于糾錯(cuò)的目標(biāo)實(shí)體之前,還包括:
根據(jù)預(yù)設(shè)編輯閾值從所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中確定候選實(shí)體集合;所述候選實(shí)體集合中的候選實(shí)體為所述實(shí)體集合中的實(shí)體;
所述基于所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的實(shí)體集合中每個(gè)實(shí)體和所述待糾錯(cuò)數(shù)據(jù)之間的相似程度值從所述實(shí)體集合中確定出用于糾錯(cuò)的目標(biāo)實(shí)體,包括:
基于所述待糾錯(cuò)數(shù)據(jù)對(duì)應(yīng)的候選實(shí)體集合中每個(gè)候選實(shí)體和所述待糾錯(cuò)數(shù)據(jù)之間的相似程度值從所述候選實(shí)體集合中確定出用于糾錯(cuò)的目標(biāo)實(shí)體。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括訓(xùn)練所述實(shí)體識(shí)別模型和所述意圖識(shí)別模型的步驟,所述訓(xùn)練所述實(shí)體識(shí)別模型和所述意圖識(shí)別模型包括:
根據(jù)第一訓(xùn)練數(shù)據(jù)對(duì)模型參量為第一參量的實(shí)體識(shí)別模型進(jìn)行訓(xùn)練,得到模型參量為第二參量的實(shí)體識(shí)別模型;
根據(jù)第二訓(xùn)練數(shù)據(jù)對(duì)模型參量為第三參量的意圖識(shí)別模型進(jìn)行訓(xùn)練,得到模型參量為第四參量的意圖識(shí)別模型;
所述第一訓(xùn)練數(shù)據(jù)和所述第二訓(xùn)練數(shù)據(jù)包括所述應(yīng)用程序的歷史識(shí)別數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910778784.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 快閃存儲(chǔ)器控制器、其糾錯(cuò)碼控制器及其方法和系統(tǒng)
- 數(shù)據(jù)記錄再現(xiàn)裝置和數(shù)據(jù)庫(kù)裝置
- 解碼器、接收裝置及其解碼方法
- 數(shù)據(jù)糾錯(cuò)方法及裝置
- 一種數(shù)據(jù)糾錯(cuò)方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 一種固態(tài)硬盤(pán)糾錯(cuò)方法、裝置、存儲(chǔ)設(shè)備及存儲(chǔ)介質(zhì)
- 基于AI深度學(xué)習(xí)的人力資源數(shù)據(jù)處理系統(tǒng)及方法
- 一種數(shù)據(jù)糾錯(cuò)方法、系統(tǒng)、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種量子密鑰分發(fā)系統(tǒng)的糾錯(cuò)方法及裝置
- 實(shí)體集合擴(kuò)展方法
- 基于人工智能的實(shí)體語(yǔ)義檢索處理方法及裝置
- 一種創(chuàng)建知識(shí)圖譜的方法及裝置
- 實(shí)體推薦方法和裝置
- 實(shí)體標(biāo)注數(shù)據(jù)集構(gòu)建方法、裝置及設(shè)備
- 用于查詢信息的方法和裝置
- 一種確定文本新穎度的方法及相關(guān)裝置
- 實(shí)體關(guān)系分析方法、裝置、分析設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 搜索由分布式數(shù)據(jù)源維護(hù)的數(shù)據(jù)結(jié)構(gòu)
- 一種實(shí)體識(shí)別方法、計(jì)算設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種相關(guān)實(shí)體確定方法、裝置及計(jì)算設(shè)備
- 信息查詢方法及裝置
- 一種實(shí)體嵌入方法及裝置
- 一種實(shí)體嵌入方法、裝置、介質(zhì)及設(shè)備
- 實(shí)體確定方法、裝置及存儲(chǔ)介質(zhì)
- 核心實(shí)體確定方法及其系統(tǒng)、服務(wù)器和計(jì)算機(jī)可讀介質(zhì)
- 文本的實(shí)體識(shí)別方法、設(shè)備及存儲(chǔ)介質(zhì)
- 資源分配方法、裝置、可讀存儲(chǔ)介質(zhì)和電子設(shè)備
- 實(shí)體對(duì)齊方法、裝置、計(jì)算機(jī)可讀介質(zhì)及電子設(shè)備
- 實(shí)體關(guān)系抽取方法、實(shí)體關(guān)系學(xué)習(xí)模型的獲取方法及設(shè)備
- 對(duì)虛擬化應(yīng)用程序的基于策略的訪問(wèn)
- 應(yīng)用程序執(zhí)行、應(yīng)用程序提供裝置和應(yīng)用程序分發(fā)方法
- 一種軟件保護(hù)方法、裝置及系統(tǒng)
- 應(yīng)用程序的開(kāi)發(fā)方法和系統(tǒng)
- 應(yīng)用程序的擴(kuò)展方法及裝置
- 一種應(yīng)用程序商店的應(yīng)用程序發(fā)布方法及裝置
- 一種應(yīng)用程序的監(jiān)控方法、裝置及系統(tǒng)
- 用于對(duì)虛擬化應(yīng)用程序的基于策略的訪問(wèn)的方法和系統(tǒng)
- 應(yīng)用程序控制方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種應(yīng)用程序安裝、卸載方法及通信終端





