[發(fā)明專利]基于眾包主動學習用于檢測異常圖片的方法有效
| 申請?zhí)枺?/td> | 201510540432.6 | 申請日: | 2015-08-28 |
| 公開(公告)號: | CN105205503B | 公開(公告)日: | 2018-09-18 |
| 發(fā)明(設(shè)計)人: | 萬里;洪敏;白金龍;李麗麗 | 申請(專利權(quán))人: | 重慶恢恢信息技術(shù)有限公司 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 重慶市前沿專利事務(wù)所(普通合伙) 50211 | 代理人: | 路寧 |
| 地址: | 400700 重慶市北碚區(qū)*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 主動 學習 用于 檢測 異常 圖片 方法 | ||
本發(fā)明公開了一種基于眾包主動學習用于檢測異常圖片的方法,包括如下步驟:S1,獲取圖像特征,從圖像特征中提取二進制向量,選取色調(diào)和飽和度作為圖像特征,合并色調(diào)和飽和度圖像特征來形成一個二維色調(diào)飽和度直方圖;S2,計算每個圖像特征的樣本密度,對樣本密度低于閾值的樣本,計算信息熵,由用戶進行標記;S3,根據(jù)眾包平臺用戶的標記和結(jié)果可信度計算方法,確定樣本的標簽,確定該標記樣本最終是否采用,并更新眾包平臺用戶的信用度,并經(jīng)由眾包平臺返回給用戶,輸出初始分類器,當初始分類器達到一定閾值后執(zhí)行S4;S4,輸出標記訓練集,輸出最終分類器。通過眾包方法有利于平臺推廣和提高用戶參與的積極性提高任務(wù)結(jié)果的質(zhì)量。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機大數(shù)據(jù)圖片處理領(lǐng)域,尤其涉及一種基于眾包主動學習用于檢測異常圖片的方法。
背景技術(shù)
當今社會,通過視頻采集模塊獲取海量視頻信息已經(jīng)應用在社會生活的很多領(lǐng)域,例如:高速公路視頻抓拍,公安系統(tǒng)安全監(jiān)控,醫(yī)學領(lǐng)域內(nèi)窺膠囊,智能樓宇視頻監(jiān)控等領(lǐng)域,但是對于海量的視頻圖像數(shù)據(jù)來說,能夠提取出用戶所需的顯著信息,例如,安全監(jiān)控中人體姿態(tài)識別、以及內(nèi)窺膠囊醫(yī)療圖像處理等;
首先,在高速公路視頻抓拍,公安系統(tǒng)安全監(jiān)控,智能樓宇視頻監(jiān)控領(lǐng)域,視頻抓拍的圖像時間跨度很長,而且移動物體和靜止物體交錯出現(xiàn),這就給判別特定特征圖像帶來極大的困難,雖然現(xiàn)有技術(shù)中有一些常規(guī)的判別特定特征圖像的方法,但是判別速度慢,而且判別準確率低,需要后期進行人工篩選和剔除,耗費了人力物力;
另外,膠囊內(nèi)窺鏡(Wireless Capsule Endoscope,WCE)取代了傳統(tǒng)插入式內(nèi)窺鏡。膠囊內(nèi)窺鏡只有普通膠囊的大小,但是其內(nèi)部集成了微型控制單元、照明裝置、無線通信系統(tǒng)和微型成像裝置。現(xiàn)在生產(chǎn)的膠囊內(nèi)窺鏡都至少以2f/s(幀每秒)的速率傳輸所拍攝到的消化道內(nèi)壁圖像,在人體內(nèi)大約停留8小時,大概產(chǎn)生67600幅圖像。隨著膠囊內(nèi)窺鏡技術(shù)的不斷發(fā)展,拍攝的速率將會更快,每次檢查獲得更多的圖片。臨床醫(yī)生要在這樣龐大數(shù)量的圖像中找到出血圖片或其他病變特征的圖片需要花費2~3小時的時間以及大量的精力,這將對醫(yī)生在心理和生理上產(chǎn)生很大的壓力,易出現(xiàn)漏判、誤判的情況。在巨大的數(shù)據(jù)量下,如何更好的管理與組織這些數(shù)據(jù)成為擺在人類面前的難題。這就亟需本領(lǐng)域技術(shù)人員解決相應的技術(shù)問題。
發(fā)明內(nèi)容
本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題,特別創(chuàng)新地提出了一種基于眾包主動學習用于檢測異常圖片的方法。
為了實現(xiàn)本發(fā)明的上述目的,本發(fā)明提供了一種基于眾包主動學習用于檢測異常圖片的方法,其包括如下步驟:
S1,獲取圖像特征,從圖像特征中提取二進制向量,選取色調(diào)和飽和度作為圖像特征,合并色調(diào)和飽和度圖像特征來形成一個二維色調(diào)飽和度直方圖;
S2,計算每個圖像特征周圍的已標記樣本密度,對已標記樣本密度低于閾值的樣本,計算信息熵,選擇信息熵最大的樣本放到眾包平臺,由用戶進行標記;
S3,根據(jù)眾包平臺用戶的標記和結(jié)果可信度計算方法,確定樣本的標簽,并臨時放入訓練集,根據(jù)可信分類迭代算法,確定該標記樣本最終是否采用,并更新眾包平臺用戶的信用度,并經(jīng)由眾包平臺返回給用戶,輸出初始分類器,當初始分類器達到一定閾值后執(zhí)行S4;
S4,當S1-S3步驟執(zhí)行完畢后,輸出標記訓練集,輸出最終分類器。
所述的基于眾包主動學習用于檢測異常圖片的方法,優(yōu)選的,所述S1包括:
取一個二進制向量表示W(wǎng)CE圖像特征,顏色空間選擇HSI顏色空間,選取色調(diào)和飽和度信息作為特征;
合并色調(diào)和飽和度圖像特征來形成一個二維色調(diào)飽和度直方圖。
所述的基于眾包主動學習用于檢測異常圖片的方法,優(yōu)選的,所述S2標記樣本密度步驟包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶恢恢信息技術(shù)有限公司,未經(jīng)重慶恢恢信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510540432.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





