[發明專利]一種標注任務處理方法、裝置、設備及存儲介質在審
| 申請號: | 202010532092.3 | 申請日: | 2020-06-11 |
| 公開(公告)號: | CN111859855A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 謝佳雨;陳偉 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06F40/117 | 分類號: | G06F40/117;G06N20/00 |
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 張子青 |
| 地址: | 100085 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 標注 任務 處理 方法 裝置 設備 存儲 介質 | ||
本公開涉及一種標注任務處理方法、裝置、設備及存儲介質。本公開通過創建多個標注任務,所述多個標注任務分別用于標注不同的實體類型,并將多個標注任務分別推送給不同的標注模塊,當該多個標注任務中的任一標注任務完成時,向執行該標注任務的標注模塊推送其他未完成的標注任務,從而使得已完成標注任務的標注模塊可以標注其他未完成的標注任務,避免已完成的標注任務對應的已標注數據過多,或避免未完成的標注任務對應的已標注數據過少,提高了標注模塊的標注資源利用率,以及提高了多個標注任務的執行效率。
技術領域
本公開涉及信息技術領域,尤其涉及一種標注任務處理方法、裝置、設備及存儲介質。
背景技術
當前在人們的日常生產、生活中會產生大量的數據集。該數據集中可能會包括不同類型的數據。隨著信息技術的不斷發展,人們更希望電子設備,例如計算機可以識別出數據集中特定類型的數據。例如,可以通過機器建模的方式,訓練出能夠識別特定類型數據的機器學習模型。
通常情況下,在對機器學習模型進行訓練之前,需要對數據集中的特定類型的數據進行標注。但是在標注過程中,無法確定當前已標注的數據是否能夠使得機器學習模型的性能達標,從而導致已標注數據過多或過少。
發明內容
為了解決上述技術問題或者至少部分地解決上述技術問題,本公開提供了一種標注任務處理方法、裝置、設備及存儲介質,以避免已完成的標注任務對應的已標注數據過多,或避免未完成的標注任務對應的已標注數據過少,從而可以提高標注模塊的標注資源利用率,以及提高多個標注任務的執行效率。
第一方面,本公開實施例提供一種標注任務處理方法,包括:
創建多個標注任務,所述多個標注任務分別用于標注不同的實體類型;
將所述多個標注任務分別推送給不同的標注模塊;
當所述多個標注任務中的任一標注任務完成時,向執行所述標注任務的標注模塊推送其他未完成的標注任務。
第二方面,本公開實施例提供一種標注任務處理裝置,包括:
標注任務管理模塊,用于創建多個標注任務,所述多個標注任務分別用于標注不同的實體類型;將所述多個標注任務分別推送給不同的標注模塊;
標注任務調度模塊,用于當所述多個標注任務中的任一標注任務完成時,向執行所述標注任務的標注模塊推送其他未完成的標注任務。
第三方面,本公開實施例提供一種標注任務處理設備,包括:
存儲器;
處理器;以及
計算機程序;
其中,所述計算機程序存儲在所述存儲器中,并被配置為由所述處理器執行以實現如第一方面所述的方法。
第四方面,本公開實施例提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行以實現第一方面所述的方法。
本公開實施例提供的標注任務處理方法、裝置、設備及存儲介質,通過創建多個標注任務,所述多個標注任務分別用于標注不同的實體類型,并將多個標注任務分別推送給不同的標注模塊,當該多個標注任務中的任一標注任務完成時,向執行該標注任務的標注模塊推送其他未完成的標注任務,從而使得已完成標注任務的標注模塊可以標注其他未完成的標注任務,避免已完成的標注任務對應的已標注數據過多,或避免未完成的標注任務對應的已標注數據過少,提高了標注模塊的標注資源利用率,以及提高了多個標注任務的執行效率。
附圖說明
此處的附圖被并入說明書中并構成本說明書的一部分,示出了符合本公開的實施例,并與說明書一起用于解釋本公開的原理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010532092.3/2.html,轉載請聲明來源鉆瓜專利網。





