[發明專利]一種構造訓練數據集的方法和裝置在審
| 申請號: | 201911293820.3 | 申請日: | 2019-12-16 |
| 公開(公告)號: | CN113065571A | 公開(公告)日: | 2021-07-02 |
| 發明(設計)人: | 劉通 | 申請(專利權)人: | 北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06T7/00 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 李陽;王志遠 |
| 地址: | 100176 北京市北京經濟技術*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 構造 訓練 數據 方法 裝置 | ||
本發明公開了一種構造訓練數據集的方法和裝置,涉及計算機技術領域。該方法包括:從待標注數據集中隨機選取兩張待標注圖像作為第一待標注圖像和第二待標注圖像,并確定第一待標注圖像的第一基礎美學標簽和第二待標注圖像的第二基礎美學標簽;將第一待標注圖像和第二待標注圖像作為輸入數據,輸入預訓練的圖像美學比較模型,得到第一評價因子和第二評價因子;根據第一評價因子和第二評價因子,更新所述第一基礎美學標簽和所述第二基礎美學標簽;重復上述步驟,直至重復次數達到閾值,將最終得到的基礎美學標簽作為待標注圖像的最終美學標簽,以得到訓練數據集。該方法和裝置降低了標注復雜度和標注成本,提高了可擴展性。
技術領域
本發明涉及計算機技術領域,尤其涉及一種構造訓練數據集的方法和裝置。
背景技術
圖像美學評價衡量了一幅圖像在人類眼中的視覺吸引力。目前,圖像美學評價算法主要通過深度神經網絡深度學習的方式,在大數據集上直接回歸圖像美學分數。
在實現本發明過程中,發明人發現現有技術中至少存在如下問題:
在基于深度學習方法的方式中,深度神經網絡需要在圖像美學數據集上進行訓練,而數據集的標注方法需要大量的人力成本。而且,對于不同類目的圖像,需要針對每個類目的圖像標注一個訓練集,這將是一件成本非常昂貴的任務。
發明內容
有鑒于此,本發明實施例提供一種構造訓練數據集的方法和裝置,能夠降低標注復雜度和標注成本,提高可擴展性。
為實現上述目的,根據本發明實施例的一個方面,提供了一種構造訓練數據集的方法,包括:
從待標注數據集中隨機選取兩張待標注圖像作為第一待標注圖像和第二待標注圖像,并確定第一待標注圖像的第一基礎美學標簽和第二待標注圖像的第二基礎美學標簽;
將所述第一待標注圖像和第二待標注圖像作為輸入數據,輸入預訓練的圖像美學比較模型,得到第一待標注圖像的第一評價因子和第二待標注圖像的第二評價因子;
根據所述第一評價因子和所述第二評價因子,更新所述第一基礎美學標簽和所述第二基礎美學標簽;
重復上述步驟,直至重復次數達到閾值,將最終得到的基礎美學標簽作為待標注圖像的最終美學標簽,以得到訓練數據集。
可選地,確定第一待標注圖像的第一基礎美學標簽和第二待標注圖像的第二基礎美學標簽包括:
將第一待標注圖像和第二待標注圖像分別作為輸入數據,輸入預訓練的基礎美學評價模型,得到第一待標注圖像的第一基礎美學標簽和第二待標注圖像的第二基礎美學標簽。
可選地,根據如下過程訓練得到所述圖像美學比較模型:
獲取各類目的多組圖像對,并通過人工方式對每一組圖像對進行標注,以生成美學比較訓練集;
對所述美學比較訓練集進行訓練,得到圖像美學比較模型。
可選地,對所述美學比較訓練集進行訓練,得到圖像美學比較模型包括:設置多種訓練方法和多種模型復雜度;基于所述多種訓練方法和多種模型復雜度,對所述美學比較訓練集進行訓練,得到多個圖像美學比較模型。
可選地,將所述第一待標注圖像和第二待標注圖像作為輸入數據,輸入預訓練的圖像美學比較模型,得到第一待標注圖像的第一評價因子和第二待標注圖像的第二評價因子包括:
將所述第一待標注圖像和第二待標注圖像作為輸入數據,輸入所述多個圖像美學比較模型中的其中一個,得到第一待標注圖像的第一評價因子和第二待標注圖像的第二評價因子;
根據所述第一評價因子和所述第二評價因子,更新所述第一基礎美學標簽和所述第二基礎美學標簽包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司,未經北京沃東天駿信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911293820.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:便于安裝的汽車電瓶支架
- 下一篇:一種便于調節使用的農業害蟲捕捉設備
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





