[發(fā)明專利]數(shù)據(jù)標注方法、裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110082238.3 | 申請日: | 2021-01-21 |
| 公開(公告)號: | CN112926621A | 公開(公告)日: | 2021-06-08 |
| 發(fā)明(設(shè)計)人: | 付志康 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京市鑄成律師事務(wù)所 11313 | 代理人: | 郭麗祥;楊瑾瑾 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 標注 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本公開提供了一種數(shù)據(jù)標注方法、裝置、電子設(shè)備及存儲介質(zhì),涉及人工智能、深度學(xué)習、指紋識別、圖像處理、短視頻處理等領(lǐng)域。具體實現(xiàn)方案為:根據(jù)第一標注數(shù)據(jù)得到第一樣本數(shù)據(jù)集;根據(jù)所述第一樣本數(shù)據(jù)集對第一模型進行訓(xùn)練,得到訓(xùn)練后的第二模型;將待標注對象輸入所述第二模型進行特征提取處理,得到指紋信息;根據(jù)所述指紋信息進行定向的類別標注,得到用于擴充所述第一樣本數(shù)據(jù)集的第二標注數(shù)據(jù)。采用本公開,可以用少量的已標注數(shù)據(jù)實現(xiàn)自動化的數(shù)據(jù)標注及定向的類別增補,從而得到數(shù)量及類別更多樣化的樣本數(shù)據(jù)集。
技術(shù)領(lǐng)域
本公開涉及計算機處理領(lǐng)域。本公開尤其涉及人工智能、深度學(xué)習、指紋識別、圖像處理、短視頻處理等領(lǐng)域。
背景技術(shù)
隨著人工智能技術(shù)的快速發(fā)展,諸多信息領(lǐng)域(如:圖像、語音、視頻、文字)人工智能技術(shù)被廣泛應(yīng)用于圖像識別、檢測、視頻分類、語音識別和文本識別等場景中。
人工智能技術(shù)應(yīng)用于任何一個場景中,都需要海量的、有效的標注數(shù)據(jù),目前的方法是通過人工標注的方式去獲得這些標注數(shù)據(jù),但是,人工標注的方式會浪費大量的人力物力,且數(shù)據(jù)類別不夠多樣化。
發(fā)明內(nèi)容
本公開提供了一種數(shù)據(jù)標注方法、裝置、電子設(shè)備及存儲介質(zhì)。
根據(jù)本公開的一方面,提供了一種數(shù)據(jù)標注方法,包括:
根據(jù)第一標注數(shù)據(jù)得到第一樣本數(shù)據(jù)集;
根據(jù)所述第一樣本數(shù)據(jù)集對第一模型進行訓(xùn)練,得到訓(xùn)練后的第二模型;
將待標注對象輸入所述第二模型進行特征提取處理,得到指紋信息;
根據(jù)所述指紋信息進行定向的類別標注,得到用于擴充所述第一樣本數(shù)據(jù)集的第二標注數(shù)據(jù)。
根據(jù)本公開的另一方面,提供了一種數(shù)據(jù)標注裝置,包括:
樣本構(gòu)建模塊,用于根據(jù)第一標注數(shù)據(jù)得到第一樣本數(shù)據(jù)集;
訓(xùn)練模塊,用于根據(jù)所述第一樣本數(shù)據(jù)集對第一模型進行訓(xùn)練,得到訓(xùn)練后的第二模型;
特征提取模塊,用于將待標注對象輸入所述第二模型進行特征提取處理,得到指紋信息;
數(shù)據(jù)標注模塊,用于根據(jù)所述指紋信息進行定向的類別標注,得到用于擴充所述第一樣本數(shù)據(jù)集的第二標注數(shù)據(jù)。
根據(jù)本公開的另一方面,提供了一種電子設(shè)備,包括:
至少一個處理器;以及
與該至少一個處理器通信連接的存儲器;其中,
該存儲器存儲有可被該至少一個處理器執(zhí)行的指令,該指令被該至少一個處理器執(zhí)行,以使該至少一個處理器能夠執(zhí)行本公開任意一實施例所提供的方法。
根據(jù)本公開的另一方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),該計算機指令用于使該計算機執(zhí)行本公開任意一項實施例所提供的方法。
根據(jù)本公開的另一方面,提供了一種計算機程序產(chǎn)品,包括計算機指令,該計算機指令被處理器執(zhí)行時實現(xiàn)本公開任意一項實施例所提供的方法。
采用本公開,可以根據(jù)第一標注數(shù)據(jù)得到第一樣本數(shù)據(jù)集;根據(jù)所述第一樣本數(shù)據(jù)集對第一模型進行訓(xùn)練,得到訓(xùn)練后的第二模型;將待標注對象輸入所述第二模型進行特征提取處理,得到指紋信息;根據(jù)所述指紋信息進行定向的類別標注,得到用于擴充所述第一樣本數(shù)據(jù)集的第二標注數(shù)據(jù)。由于可以采用第一標注數(shù)據(jù)(少量的已標注數(shù)據(jù))實現(xiàn)自動化的數(shù)據(jù)標注及定向的類別增補,從而得到數(shù)量及類別更多樣化的樣本數(shù)據(jù)集。
應(yīng)當理解,本部分所描述的內(nèi)容并非旨在標識本公開的實施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110082238.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:觸控操作執(zhí)行方法及裝置
- 下一篇:圓盤式焊接機
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





