[發(fā)明專利]應(yīng)用于數(shù)據(jù)管理平臺(tái)的訓(xùn)練數(shù)據(jù)處理方法、裝置和電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202011453145.9 | 申請(qǐng)日: | 2020-12-11 |
| 公開(公告)號(hào): | CN112580706A | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設(shè)計(jì))人: | 王蕾;趙明;郭龍;孫韶言;戴鵬翔 | 申請(qǐng)(專利權(quán))人: | 北京地平線機(jī)器人技術(shù)研發(fā)有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 北京唐頌永信知識(shí)產(chǎn)權(quán)代理有限公司 11755 | 代理人: | 劉偉 |
| 地址: | 100080 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 應(yīng)用于 數(shù)據(jù)管理 平臺(tái) 訓(xùn)練 數(shù)據(jù)處理 方法 裝置 電子設(shè)備 | ||
1.一種應(yīng)用于數(shù)據(jù)管理平臺(tái)的訓(xùn)練數(shù)據(jù)處理方法,包括:
獲取用戶采集到的原始數(shù)據(jù);
獲取與所述原始數(shù)據(jù)對(duì)應(yīng)的標(biāo)注結(jié)果;
確定訓(xùn)練任務(wù)的數(shù)據(jù)需求;以及
根據(jù)所述數(shù)據(jù)需求從具有所述標(biāo)注結(jié)果的所述原始數(shù)據(jù)生成用于所述訓(xùn)練任務(wù)的第一訓(xùn)練數(shù)據(jù)。
2.如權(quán)利要求1所述的訓(xùn)練數(shù)據(jù)處理方法,其中,所述方法進(jìn)一步包括:
獲取與用于采集所述原始數(shù)據(jù)的設(shè)備有關(guān)的采集信息;以及
基于所述采集信息設(shè)置所述原始數(shù)據(jù)的篩選標(biāo)簽。
3.如權(quán)利要求2所述的訓(xùn)練數(shù)據(jù)處理方法,其中,獲取與所述原始數(shù)據(jù)對(duì)應(yīng)的標(biāo)注結(jié)果包括:
使用預(yù)設(shè)的標(biāo)注篩選算法基于所述篩選標(biāo)簽篩選所述原始數(shù)據(jù)以獲得待標(biāo)注數(shù)據(jù);
將所述待標(biāo)注數(shù)據(jù)發(fā)送到用于數(shù)據(jù)標(biāo)注的平臺(tái);以及
從所述用于數(shù)據(jù)標(biāo)注的平臺(tái)接收所述待標(biāo)注數(shù)據(jù)的標(biāo)注結(jié)果。
4.如權(quán)利要求1所述的訓(xùn)練數(shù)據(jù)處理方法,其中,在從所述用于數(shù)據(jù)標(biāo)注的平臺(tái)接收所述待標(biāo)注數(shù)據(jù)的標(biāo)注結(jié)果之后進(jìn)一步包括:
確定所述標(biāo)注結(jié)果是否合格;以及
響應(yīng)于所述標(biāo)注結(jié)果不合格,將所述待標(biāo)注數(shù)據(jù)發(fā)送到用于數(shù)據(jù)標(biāo)注的平臺(tái),所述用于數(shù)據(jù)標(biāo)注的平臺(tái)對(duì)所述標(biāo)注數(shù)據(jù)進(jìn)行重新標(biāo)注。
5.如權(quán)利要求1所述的訓(xùn)練數(shù)據(jù)處理方法,其中,在從所述用于數(shù)據(jù)標(biāo)注的平臺(tái)接收所述待標(biāo)注數(shù)據(jù)的標(biāo)注結(jié)果之后進(jìn)一步包括:
確定具有所述標(biāo)注結(jié)果的所述原始數(shù)據(jù)的數(shù)據(jù)量是否足夠;以及
響應(yīng)于所述原始數(shù)據(jù)的數(shù)據(jù)量不足,繼續(xù)獲取用戶采集到的原始數(shù)據(jù)。
6.如權(quán)利要求1所述的訓(xùn)練數(shù)據(jù)處理方法,其中,在獲取與所述原始數(shù)據(jù)對(duì)應(yīng)的標(biāo)注結(jié)果之后進(jìn)一步包括:
將所述原始數(shù)據(jù)和所述原始數(shù)據(jù)對(duì)應(yīng)的標(biāo)注結(jié)果匹配地存儲(chǔ)在數(shù)據(jù)庫(kù)中;以及
對(duì)于匹配地存儲(chǔ)的原始數(shù)據(jù)及其標(biāo)注結(jié)果設(shè)置至少一個(gè)標(biāo)簽信息。
7.如權(quán)利要求6所述的訓(xùn)練數(shù)據(jù)處理方法,其中,根據(jù)所述數(shù)據(jù)需求從具有所述標(biāo)注結(jié)果的所述原始數(shù)據(jù)生成用于所述訓(xùn)練任務(wù)的訓(xùn)練數(shù)據(jù)包括:
根據(jù)所述數(shù)據(jù)需求,基于所述至少一個(gè)標(biāo)簽信息從具有所述標(biāo)注結(jié)果的所述原始數(shù)據(jù)選擇用于所述訓(xùn)練任務(wù)的第一訓(xùn)練數(shù)據(jù)。
8.如權(quán)利要求1所述的訓(xùn)練數(shù)據(jù)處理方法,進(jìn)一步包括:
將用于所述訓(xùn)練任務(wù)的所述第一訓(xùn)練數(shù)據(jù)發(fā)送到運(yùn)行所述訓(xùn)練任務(wù)的訓(xùn)練平臺(tái)。
9.如權(quán)利要求1所述的訓(xùn)練數(shù)據(jù)處理方法,進(jìn)一步包括:
獲取所述訓(xùn)練任務(wù)的訓(xùn)練代碼;
基于所述訓(xùn)練代碼獲得用于對(duì)所述第一訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理的附加信息;以及
基于所述附加信息對(duì)所述第一訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理以獲得用于所述訓(xùn)練任務(wù)的第二訓(xùn)練數(shù)據(jù);以及
將所述第二訓(xùn)練數(shù)據(jù)發(fā)送到運(yùn)行所述訓(xùn)練任務(wù)的訓(xùn)練平臺(tái)。
10.如權(quán)利要求9所述的訓(xùn)練數(shù)據(jù)處理方法,其中,用于所述訓(xùn)練任務(wù)的附加訓(xùn)練信息包括所述訓(xùn)練數(shù)據(jù)的環(huán)境依賴和開始腳本。
11.如權(quán)利要求9所述的訓(xùn)練數(shù)據(jù)處理方法,其中,將所述第二訓(xùn)練數(shù)據(jù)發(fā)送到運(yùn)行所述訓(xùn)練任務(wù)的訓(xùn)練平臺(tái)包括:
基于所述第二訓(xùn)練數(shù)據(jù)和所述訓(xùn)練代碼生成所述訓(xùn)練任務(wù);以及
將所述訓(xùn)練任務(wù)發(fā)送到所述訓(xùn)練平臺(tái)。
12.一種應(yīng)用于數(shù)據(jù)管理平臺(tái)的訓(xùn)練數(shù)據(jù)處理裝置,包括:
數(shù)據(jù)獲取單元,用于獲取用戶采集到的原始數(shù)據(jù);
標(biāo)注獲取單元,用于獲取與所述數(shù)據(jù)獲取單元所獲取的所述原始數(shù)據(jù)對(duì)應(yīng)的標(biāo)注結(jié)果;
需求確定單元,用于確定訓(xùn)練任務(wù)的數(shù)據(jù)需求;以及
數(shù)據(jù)生成單元,用于根據(jù)所述需求確定單元所確定的所述數(shù)據(jù)需求從具有所述標(biāo)注獲取單元所獲取的標(biāo)注結(jié)果的所述原始數(shù)據(jù)生成用于所述訓(xùn)練任務(wù)的第一訓(xùn)練數(shù)據(jù)。
13.一種電子設(shè)備,包括:
處理器;以及
存儲(chǔ)器,在所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序指令,所述計(jì)算機(jī)程序指令在被所述處理器運(yùn)行時(shí)使得所述處理器執(zhí)行如權(quán)利要求1-11中任一項(xiàng)所述的應(yīng)用于數(shù)據(jù)管理平臺(tái)的訓(xùn)練數(shù)據(jù)處理方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京地平線機(jī)器人技術(shù)研發(fā)有限公司,未經(jīng)北京地平線機(jī)器人技術(shù)研發(fā)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011453145.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 民用大飛機(jī)機(jī)載網(wǎng)絡(luò)的數(shù)據(jù)管理系統(tǒng)及方法
- 一種移動(dòng)應(yīng)用安全管控方法和設(shè)備
- 基于數(shù)據(jù)庫(kù)管理系統(tǒng)的電極加工管理系統(tǒng)
- 一種數(shù)據(jù)管理方法及裝置
- 基于XBRL標(biāo)準(zhǔn)的主數(shù)據(jù)管理系統(tǒng)的設(shè)計(jì)方法
- 大數(shù)據(jù)環(huán)境下實(shí)現(xiàn)數(shù)據(jù)管理能力評(píng)估的系統(tǒng)及其方法
- 一種基于Hadoop的數(shù)據(jù)管理系統(tǒng)及其管理方法
- 物聯(lián)網(wǎng)檢測(cè)數(shù)據(jù)管理系統(tǒng)及物聯(lián)網(wǎng)檢測(cè)數(shù)據(jù)管理方法
- 基于核心對(duì)象的一體化數(shù)據(jù)管理系統(tǒng)
- 數(shù)據(jù)管理方法、數(shù)據(jù)管理裝置、電子設(shè)備及存儲(chǔ)介質(zhì)





