[發(fā)明專利]數(shù)據(jù)處理方法、裝置及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110397661.2 | 申請日: | 2021-04-14 |
| 公開(公告)號: | CN113254635B | 公開(公告)日: | 2021-11-05 |
| 發(fā)明(設(shè)計)人: | 李晨曦;荊寧 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/216;G06F40/126 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù)處理 方法 裝置 存儲 介質(zhì) | ||
本申請實施例提出了一種數(shù)據(jù)處理方法、裝置及存儲介質(zhì),涉及計算機技術(shù)領(lǐng)域,該方法包括:獲取待處理文本中的目標(biāo)實體,所述目標(biāo)實體為所述待處理文本中任一實體;調(diào)用第一分類網(wǎng)絡(luò)對所述目標(biāo)實體的第一類別信息和實體類型先驗數(shù)據(jù)進行處理,以得到所述目標(biāo)實體的第二類別信息,所述第一類別信息是通過調(diào)用第二分類網(wǎng)絡(luò)對所述待處理文本和所述目標(biāo)實體進行處理得到的;基于所述第二類別信息確定所述目標(biāo)實體的分類結(jié)果,所述分類結(jié)果包括至少一個實體類型,可以利用實體類型先驗數(shù)據(jù),有效地提升對實體進行細(xì)粒度分類的準(zhǔn)確度。
技術(shù)領(lǐng)域
本申請涉及計算機技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)處理方法、裝置及存儲介質(zhì)。
背景技術(shù)
自然語言中的實體是指語句中出現(xiàn)的客觀世界中存在的,并可相互區(qū)別的對象或概念。實體的實體類型識別就是給定一個實體及其所在的上下文,確定實體在該上下文中的類型,比如“蘋果”作為一個實體可以是“水果”、“手機”、“公司”。實體類型識別是自然語言處理(Natural Language Processing,NLP)領(lǐng)域中一些復(fù)雜任務(wù)的基礎(chǔ),例如語義分析、問答系統(tǒng)、機器翻譯、知識圖譜構(gòu)建等,因此一直以來都是NLP領(lǐng)域中的研究熱點。
目前通常是基于實體和實體的上下文文本來確定實體的分類結(jié)果,一般準(zhǔn)確度不高,特別是由于短文本存在文本信息不足、噪音等問題,導(dǎo)致準(zhǔn)確度會更低。
發(fā)明內(nèi)容
本申請實施例提供了一種數(shù)據(jù)處理方法、裝置及存儲介質(zhì),可以利用實體類型先驗數(shù)據(jù),有效地提升對實體進行細(xì)粒度分類的準(zhǔn)確度。
一方面,本申請實施例提供了一種數(shù)據(jù)處理方法,所述方法包括:
獲取待處理文本中的目標(biāo)實體,所述目標(biāo)實體為所述待處理文本中任一實體;
調(diào)用第一分類網(wǎng)絡(luò)對所述目標(biāo)實體的第一類別信息和實體類型先驗數(shù)據(jù)進行處理,以得到所述目標(biāo)實體的第二類別信息,所述第一類別信息是通過調(diào)用第二分類網(wǎng)絡(luò)對所述待處理文本和所述目標(biāo)實體進行處理得到的;
基于所述第二類別信息確定所述目標(biāo)實體的分類結(jié)果,所述分類結(jié)果包括至少一個實體類型。
另一方面,本申請實施例提供了一種數(shù)據(jù)處理裝置,所述裝置包括:
獲取模塊,用于獲取待處理文本中的目標(biāo)實體,所述目標(biāo)實體為所述待處理文本中任一實體;
處理模塊,用于調(diào)用第一分類網(wǎng)絡(luò)對所述目標(biāo)實體的第一類別信息和實體類型先驗數(shù)據(jù)進行處理,以得到所述目標(biāo)實體的第二類別信息,所述第一類別信息是通過調(diào)用第二分類網(wǎng)絡(luò)對所述待處理文本和所述目標(biāo)實體進行處理得到的;
所述處理模塊,還用于基于所述第二類別信息確定所述目標(biāo)實體的分類結(jié)果,所述分類結(jié)果包括至少一個實體類型。
相應(yīng)地,本申請實施例提供了一種計算機設(shè)備,該設(shè)備包括處理器、通信接口和存儲器,所述處理器、所述通信接口和所述存儲器相互連接,其中,所述存儲器存儲有可執(zhí)行程序代碼,所述處理器用于調(diào)用所述可執(zhí)行程序代碼,執(zhí)行上述任一可能實現(xiàn)方式所述的數(shù)據(jù)處理方法。
相應(yīng)地,本申請實施例提供了一種計算機可讀存儲介質(zhì),存儲有計算機程序,所述處理器執(zhí)行上述任一可能實現(xiàn)方式所述的數(shù)據(jù)處理方法所涉及的程序。
相應(yīng)地,本申請實施例提供了一種計算機程序產(chǎn)品或計算機程序,該計算機程序產(chǎn)品或計算機程序包括計算機指令,該計算機指令存儲在計算機可讀存儲介質(zhì)中。計算機設(shè)備的處理器從計算機可讀存儲介質(zhì)讀取該計算機指令,處理器執(zhí)行該計算機指令,使得該計算機設(shè)備執(zhí)行上述任一可能實現(xiàn)方式所述的數(shù)據(jù)處理方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110397661.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種便攜的防潮檔案盒
- 下一篇:LDMOS器件和形成LDMOS器件的方法
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





