[發(fā)明專利]標注數(shù)據(jù)處理方法、相關(guān)裝置及計算機程序產(chǎn)品有效
| 申請?zhí)枺?/td> | 202110671215.6 | 申請日: | 2021-06-17 |
| 公開(公告)號: | CN113313196B | 公開(公告)日: | 2023-10-27 |
| 發(fā)明(設(shè)計)人: | 楊雪 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06V10/94 | 分類號: | G06V10/94 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 標注 數(shù)據(jù)處理 方法 相關(guān) 裝置 計算機 程序 產(chǎn)品 | ||
本公開提供了標注數(shù)據(jù)處理方法、裝置、電子設(shè)備、計算機可讀存儲介質(zhì)及計算機程序產(chǎn)品,涉及數(shù)據(jù)標注、信息處理和任務分配等人工智能技術(shù)領(lǐng)域。該方法的一具體實施方式包括:根據(jù)待標注任務的數(shù)據(jù)類型和標注需求種類確定相應的標注需求項后,確定與該標注需求項對應的第一能力項,在不存在完全具有該第一能力項的匹配標注對象時,根據(jù)剩余的非匹配標注對象所具有的第二能力項與該第一能力項的差異,確定替代標注對象,最終將該待標注任務分配給該替代標注對象進行標注,得到替代標注結(jié)果。該實施方式在缺少與標注需求項完全匹配的標注對象時尋找替代標注對象,以通過替代標注對象提升數(shù)據(jù)標注質(zhì)量。
技術(shù)領(lǐng)域
本公開涉及計算機技術(shù)領(lǐng)域,具體涉及數(shù)據(jù)標注、信息處理和任務分配等人工智能技術(shù)領(lǐng)域,尤其涉及標注數(shù)據(jù)處理方法、裝置、電子設(shè)備、計算機可讀存儲介質(zhì)及計算機程序產(chǎn)品。
背景技術(shù)
隨著人工智能在各方面的發(fā)展和應用,對數(shù)據(jù)進行符合要求的標注的需求量得到空前增長。數(shù)據(jù)標注是為人工智能算法提供結(jié)構(gòu)化數(shù)據(jù)的過程,標注過程一般通過數(shù)據(jù)眾包或者代理的方式,由標注員去完成。現(xiàn)今的自動標注模型的實用性還無法滿足要求。
因此,如何更好的處理標注數(shù)據(jù),是本領(lǐng)域技術(shù)人員研究的重點。
發(fā)明內(nèi)容
本公開實施例提出了一種標注數(shù)據(jù)處理方法、裝置、電子設(shè)備、計算機可讀存儲介質(zhì)及計算機程序產(chǎn)品。
第一方面,本公開實施例提出了一種標注數(shù)據(jù)處理方法,包括:根據(jù)待標注任務的數(shù)據(jù)類型和標注需求種類確定相應的標注需求項;確定與該標注需求項對應的第一能力項;響應于不存在完全具有該第一能力項的匹配標注對象,根據(jù)剩余的非匹配標注對象所具有的第二能力項與該第一能力項的差異,確定替代標注對象;將該待標注任務分配給該替代標注對象進行標注,得到替代標注結(jié)果。
第二方面,本公開實施例提出了一種標注數(shù)據(jù)處理裝置,包括:標注需求項確定單元,被配置成根據(jù)待標注任務的數(shù)據(jù)類型和標注需求種類確定相應的標注需求項;第一能力項確定單元,被配置成確定與該標注需求項對應的第一能力項;替代標注對象確定單元,被配置成響應于不存在完全具有該第一能力項的匹配標注對象,根據(jù)剩余的非匹配標注對象所具有的第二能力項與該第一能力項的差異,確定替代標注對象;替代標注結(jié)果生成單元,被配置成將該待標注任務分配給該替代標注對象進行標注,得到替代標注結(jié)果。
第三方面,本公開實施例提供了一種電子設(shè)備,該電子設(shè)備包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器;其中,存儲器存儲有可被至少一個處理器執(zhí)行的指令,該指令被至少一個處理器執(zhí)行,以使至少一個處理器執(zhí)行時能夠?qū)崿F(xiàn)如第一方面中任一實現(xiàn)方式描述的標注數(shù)據(jù)處理方法。
第四方面,本公開實施例提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),該計算機指令用于使計算機執(zhí)行時能夠?qū)崿F(xiàn)如第一方面中任一實現(xiàn)方式描述的標注數(shù)據(jù)處理方法。
第五方面,本公開實施例提供了一種包括計算機程序的計算機程序產(chǎn)品,該計算機程序在被處理器執(zhí)行時能夠?qū)崿F(xiàn)如第一方面中任一實現(xiàn)方式描述的標注數(shù)據(jù)處理方法。
本公開實施例提供的標注數(shù)據(jù)處理方法、裝置、電子設(shè)備、計算機可讀存儲介質(zhì)及計算機程序產(chǎn)品,根據(jù)待標注任務的數(shù)據(jù)類型和標注需求種類確定相應的標注需求項后,確定與該標注需求項對應的第一能力項,在不存在完全具有該第一能力項的匹配標注對象時,根據(jù)剩余的非匹配標注對象所具有的第二能力項與該第一能力項的差異,確定替代標注對象,最終將該待標注任務分配給該替代標注對象進行標注,得到替代標注結(jié)果。
本公開在缺少與基于待標注任務的數(shù)據(jù)類型和標注需求種類確定的標注需求項完全匹配的標注對象時,通過剩余的非匹配標注對象所具有的第二能力項與第一能力項的差異尋找替代標注對象,以通過替代標注對象提升數(shù)據(jù)標注質(zhì)量。
應當理解,本部分所描述的內(nèi)容并非旨在標識本公開的實施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110671215.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





