[發明專利]一種基于眾包的圖片分組采集系統有效
| 申請號: | 201810343483.3 | 申請日: | 2018-04-17 |
| 公開(公告)號: | CN108764279B | 公開(公告)日: | 2021-10-15 |
| 發明(設計)人: | 梅建萍;胡業晟 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖片 分組 采集 系統 | ||
一種基于眾包的圖片分組采集系統,包括:登錄注冊修改設置模塊,用于用戶需經過注冊、登錄,系統通過數據庫修改和保存用戶信息;隨機讀取圖片模塊,根據用戶選擇的任務中每組圖像的數目N從圖庫中隨機選取待分組圖片和提示;交互界面設計模塊,通過分組的方式用戶將圖片分別歸入不同的組別;用戶操作記錄保存模塊,用于對用戶的一些操作記錄進行保存;眾包結果評估模塊,用于通過矩陣的方式來表示標簽之間的關系,通過計算得到用戶分組的準確度;展示和導出模塊,用于對聚類結果進行展示并可導出為不同格式的文件;數據庫設計模塊,用于設計類,分別儲存用戶信息、圖片信息、聚類任務信息和包任務信息。本發明提升面向聚類的輔助信息的有效性。
技術領域
本發明涉及機器學習和圖像識別領域,更進一步涉及一種基于眾包的圖片分組采集系統。
背景技術
在很多半監督圖像聚類方法中,都要用到某種表示的輔助信息來輔助聚類,比如帶有類別標簽的圖像或者兩個圖像之間的約束關系,即兩個圖像是否屬于同一個類。眾包提供了一種相對廉價的獲取人工給出的輔助信息的技術,已經被學術界和商業界成功應用。由于聚類分析一般用于探索性數據分析,即聚類前并不清楚有多少個類以及每個類的信息分別是什么,在實際應用中就不能定義類別的標簽。兩兩約束關系雖然在大多數聚類問題中都適用,但是由于每個約束只涉及兩個圖像,需要大量約束才能使得聚類效果得到明顯改善。因此,定義新的更加有效的輔助信息類型并且通過眾包來獲取對開發更加高效、廉價的半監督聚類方法具有重要意義。
發明內容
為了克服已有技術面向聚類的輔助信息的有效性較差的不足,本發明提供了一種提升面向聚類的輔助信息的有效性的基于眾包的圖片分組采集系統,通過眾包平臺讓參與者對從目標圖像庫中抽取的若干個圖像進行分組從而采集多個圖像子集的分組結果。
本發明解決其技術問題所采用的技術方案是:
一種基于眾包的圖片分組采集系統,所述系統包括:
登錄注冊修改設置模塊,用于用戶需經過注冊、登錄,系統通過數據庫修改和保存用戶信息;
隨機讀取圖片模塊,根據用戶選擇的任務中每組圖像的數目N從圖庫中隨機選取待分組圖片和提示;
交互界面設計模塊,通過分組的方式用戶將圖片分別歸入不同的組別,若沒有所需組別可新增分組;每個組別能夠添加新標簽,在分組完成或者需要休息時點擊提交將已經分組的數據提交給數據庫進行儲存;
用戶操作記錄保存模塊,用于對用戶的一些操作記錄進行保存,包括完成任務需要的時間,任務個數,以及完成分組的圖片數目。
眾包結果評估模塊,用于通過矩陣的方式來表示標簽之間的關系,通過計算得到用戶分組的準確度;
展示和導出模塊,用于對聚類結果進行展示,分組展示和列表展示,并可導出為不同格式的文件;
數據庫設計模塊,用于設計4個類,分別儲存用戶信息、圖片信息、聚類任務信息和包任務信息。
進一步,所述隨機讀取圖片模塊中;設數據庫中有X0張未分組的圖片,以及l個已分組的圖片子集庫L;根據用戶選擇的任務中每組圖片的數目N(N≥10)以及所需要的示例數,從L隨機抽取k+k′(k≥1,k′≥0)個已分組的圖片子集,其中k個分組共包含P(PN)張圖片的分組結果被隱藏只用于最后的評估,k′個分組結果向用戶展示作為提示;從X0抽取N-P張未分組的圖片構成N張待分組的圖片。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810343483.3/2.html,轉載請聲明來源鉆瓜專利網。





