[發明專利]一種獲取圖片標注數據的方法和系統有效
| 申請號: | 201710890130.0 | 申請日: | 2017-09-27 |
| 公開(公告)號: | CN107908641B | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 劉國翌;李廣 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/58 | 分類號: | G06F16/58;G06F40/279;G06N3/04 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 獲取 圖片 標注 數據 方法 系統 | ||
本申請提供一種獲取圖片標注數據的方法和系統,所述方法包括:獲取待標注的圖片的識別結果;將待標注圖片與候選字符顯示于猜詞界面,所述候選字符至少包括所述識別結果被拆分后得到的各字符;利用用戶在猜詞界面對所述候選字符的選擇,獲取所述待標注圖片的標注數據。本申請所述獲取圖片標注數據的方法和系統,通過將待標注圖片以猜詞游戲的方式呈現給用戶,用戶通過猜詞完成對該圖片的標注;無需占用大量計算資源,且無需招募專業標注或外包人員,降低了圖片標注數據的獲取成本;由于用戶進行游戲是根據自身意愿,并且每次標定的任務都能獲得積分獎勵,提高了用戶進行游戲的成就感和積極性,基本消除了作弊可能,從而在一定程度上提高了準確性。
【技術領域】
本申請涉及計算機處理技術領域,尤其涉及一種獲取圖片標注數據的方法和系統。
【背景技術】
在互聯網產生和存儲的海量信息中,圖片是一種重要的信息載體,在互聯網信息提供和信息檢索服務中,對圖片信息進行的處理也顯得越來越重要。
圖片標注是計算機視覺領域訓練數據準備的一項很重要的工作,通常需要大量人工標注的圖片作為機器學習和計算機視覺的進一步數據處理和數據挖掘的初始訓練數據集。現有獲得圖片人工標注數據的方法主要通過專門的標注人員、外包或眾包的方式,人工對圖片進行標注。
但是,由于圖片標注是一項枯燥、簡單重復的勞動,長時間標注無論對標注人員的生理還是心理都有傷害,人力成本較高。
另外,當需要人工標注的圖片的數量較多時,還會出現作弊的可能,可能會有部分標注人員為了盡快完成標注任務額度,在標注的過程中胡亂標注一些圖片。
【發明內容】
本申請的多個方面提供一種獲取圖片標注數據的方法和系統,用于降低圖片標注數據的獲取成本。
本申請的一方面,提供一種獲取圖片標注數據的方法,包括:
獲取待標注的圖片的識別結果;
將待標注圖片與候選字符顯示于猜詞界面,所述候選字符至少包括所述識別結果被拆分后得到的各字符;
利用用戶在猜詞界面對所述候選字符的選擇,獲取所述待標注圖片的標注數據。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述獲取待標注的圖片的識別結果包括:通過機器學習獲取待標注的圖片的識別結果。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述候選字符還包括:
隨機產生的干擾字符。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述將待標注圖片與候選字符顯示于猜詞界面還包括:
在所述猜詞界面中,提供更換待標注圖片的組件;
當點擊所述組件時,在所述猜詞界面更換下一張待標注圖片與候選字符。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述用戶在猜詞界面對所述候選字符的選擇包括:
用戶根據待標注圖片的內容選擇一個候選字符,或者按順序選擇多個候選字符組成詞或短語。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述利用用戶在猜詞界面對所述候選字符的選擇,獲取所述待標注圖片的標注數據還包括:
記錄多個用戶對同一個待標注圖片對應的候選字符的選擇,如果超過設定比例的用戶選擇相同,則將對所述候選字符的選擇結果確定為所述待標注圖片的標注數據。
如上所述的方面和任一可能的實現方式,進一步提供一種實現方式,所述方法還包括:將待標注圖片與所述標注數據作為樣本數據用于機器學習的識別模型的訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710890130.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種PCB的制作方法和PCB
- 下一篇:一種用于LCD液晶顯示屏的FPC板
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





