[發明專利]圖像分類的方法和裝置有效
| 申請號: | 201710300731.1 | 申請日: | 2017-05-02 |
| 公開(公告)號: | CN107122801B | 公開(公告)日: | 2020-03-03 |
| 發明(設計)人: | 萬韶華 | 申請(專利權)人: | 北京小米移動軟件有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 宋揚;劉芳 |
| 地址: | 100085 北京市海淀區清河*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 分類 方法 裝置 | ||
1.一種圖像分類的方法,其特征在于,包括:
獲取圖像的主題頻次;
獲取類別矩陣,所述類別矩陣中包含C個類別的向量,每個類別的向量服從正態分布,所述C為大于等于2的整數;
根據所述圖像的主題頻次和所述類別矩陣,利用分類器,獲取所述圖像的類別;
其中,所述獲取圖像的主題頻次,包括:
以預設間距提取圖像的所有相鄰視覺詞匯對,所述相鄰視覺詞匯對中包含第一視覺詞匯和第二視覺詞匯,所述第一視覺詞匯對應的提取位置和所述第二視覺詞匯對應的提取位置相鄰;
獲取每個相鄰視覺詞匯對對應的主題對;
根據所述圖像的所有相鄰視覺詞匯對對應的主題對,確定所述圖像的主題頻次;
所述獲取每個相鄰視覺詞匯對對應的主題對,包括:
獲取所述圖像對應的相鄰主題概率矩陣;
獲取每個主題對應的視覺詞匯概率向量;
根據所述相鄰主題概率矩陣和所述每個主題對應的視覺詞匯概率向量,獲取每個相鄰視覺詞匯對對應的主題對。
2.根據權利要求1所述的方法,其特征在于,所述根據所述相鄰主題概率矩陣和所述每個主題對應的視覺詞匯概率向量,獲取每個相鄰視覺詞匯對對應的主題對,包括:
獲取每個相鄰視覺詞匯對的N個候選主題對,其中,所述候選主題對包含第一候選主題和第二候選主題;
針對所述N個候選主題對中的每個所述候選主題對,根據所述相鄰主題概率矩陣和所述每個主題對應的視覺詞匯概率向量,獲取所述相鄰視覺詞匯對為所述候選主題對的概率;
根據獲取的N個所述相鄰視覺詞匯對為所述候選主題對的概率,確定最大概率對應的候選主題對為所述相鄰視覺詞匯對對應的主題對。
3.根據權利要求2所述的方法,其特征在于,所述根據所述相鄰主題概率矩陣和所述每個主題對應的視覺詞匯概率向量,獲取所述相鄰視覺詞匯對為所述候選主題對的概率,包括:
根據所述相鄰主題概率矩陣,獲取所述候選主題對為相鄰主題的第一概率;
根據所述每個主題對應的視覺詞匯概率向量,獲取所述第一候選主題為第一視覺詞匯的第二概率,以及所述第二候選主題為所述第二視覺詞匯的第三概率;
根據所述第一概率、所述第二概率和所述第三概率,獲取所述相鄰視覺詞匯對為所述候選主題對的概率。
4.根據權利要求1所述的方法,其特征在于,所述獲取所述圖像對應的相鄰主題概率矩陣,包括:
根據Θd~Dir(α)作一次概率抽取,獲取所述圖像對應的相鄰主題概率矩陣,其中,Dir(α)是參數為α的狄利克雷概率分布,Θd為第d幅圖像對應的相鄰主題概率矩陣,其中,d為大于等于1小于等于D的整數,所述D為所有圖像的總數。
5.根據權利要求4所述的方法,其特征在于,所述獲取每個主題對應的視覺詞匯概率向量,包括:
根據βk~Dir(γ)作一次概率抽取,獲取每個主題對應的視覺詞匯概率向量,其中,Dir(γ)是參數為γ的狄利克雷概率分布,βk為第k個主題對應的視覺詞匯概率向量,其中,k為大于等于1小于等于K的整數,所述K為所有主題的總數。
6.根據權利要求5所述的方法,其特征在于,所述根據所述圖像的主題頻次和所述類別矩陣,利用分類器,獲取所述圖像的類別,包括:
根據獲取所述圖像的類別,其中,是圖像的主題頻次直方圖;Zdi表示第d幅圖像的第i個主題,Zdj表示第d幅圖像的第j個主題,|zd|表示第d幅圖像的主題的個數;
η=[η1,η2,......,ηC]T,其中,ηc表示softmax函數第c個類別的向量,ηc~N(0,ρ2),c為大于等于1小于等于C的整數,C為所有類別的總數,N(0,ρ2)為均值為0,方差為ρ2的正太分布。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司,未經北京小米移動軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710300731.1/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





