[發明專利]一種基于半監督主題建模的圖像標注方法有效
| 申請號: | 201210050398.0 | 申請日: | 2012-02-29 |
| 公開(公告)號: | CN102637199A | 公開(公告)日: | 2012-08-15 |
| 發明(設計)人: | 何曉飛;卜佳俊;陳純;倪雅博 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 杭州天正專利事務所有限公司 33201 | 代理人: | 王兵;黃美娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 主題 建模 圖像 標注 方法 | ||
1.一種基于半監督主題建模的圖像標注方法,其特征在于:
1)從互聯網上得到圖像,包括已有文本標注的圖像,以及未標注圖像;
2)利用一種類似于概率潛在語義分析的模型,對所有圖像的視覺特征和文本標注之間的聯系通過潛在主題進行建模;
3)構建所有圖像的最近鄰圖,并根據由最近鄰圖進行建模得到的流形結構對步驟2)的模型進行調整;
4)通過期望最大化算法學習步驟2)的模型,并分別計算各個潛在主題與圖像匹配的概率;
5)根據潛在主題匹配圖像的概率計算每個文本標注匹配未標注圖像的概率,并選擇概率最高的文本標注對未標注圖像進行標注。
2.根據權利要求1所述的一種半監督下的基于主題建模的圖像標注的方法,其特征在于:步驟2)中的建模過程是按照如下方式進行的:對于每個圖像i,首先用向量Fi表示圖像視覺特征,向量Wi來表示圖像文本標注,其中Fi={f1,…,fn},其中fu表示第u個視覺特征單詞在第i個圖片中出現的次數;Wi={w1,…,wn},其中wv表示第v個文本標注單詞在第i個圖片中出現的次數。
并假設fi(其中i=1,…,n)服從多項式分布wi(其中i=1,…,n)服從多項式分布未標注圖像Wi=0;然后用多項分布α建模圖像與潛在主題Zi的關系,
最后得到所有圖像與潛在主題的匹配概率的對數似然為L,L的計算公式如下:
其中,I為圖像總數,K為潛在主題總數,P(zk|α)表示在α分布下潛在主題zk與第i個圖像匹配的概率,U為視覺特征單詞總數,P(fu|zk,β)表示在β分布下視覺特征fu與潛在主題zk匹配的概率,V為圖像文本特征單詞總數,表示在分布下文本標注wv與潛在主題zk匹配的概率。
3.根據權利要求1所述的一種半監督下的基于主題建模的圖像標注的方法,其特征在于:步驟3)中的最近鄰圖的構造方法為,所有圖像構成最近鄰圖的點,若圖像i與圖像j的文本標注和視覺特征的重合度達到某個閥值,則在最近鄰圖中創建一條連接圖像i與圖像j的邊。
4.根據權利要求1所述的一種半監督下的基于主題建模的圖像標注的方法,其特征在于:步驟4)中使用期望最大化算法計算學習步驟2)的模型,并分別計算各個潛在主題與圖像匹配的概率,以及三個多項式分布α,β,Φ。
5.根據權利要求1所述的一種半監督下的基于主題建模的圖像標注的方法,其特征在于:步驟5)中利用步驟4)所得到的結果,從而獲得文本標注匹配未標注圖像的概率,并選取概率最大的文本標注對未標注圖像進行標注,文本標注匹配未標注圖像的概率P(wv)的計算公式如下:
其中,K為潛在主題總數,pki為步驟4)所得到的潛在主題與圖像匹配的概率,表示在分布下文本標注wv與潛在主題zk匹配的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210050398.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:輥套
- 下一篇:基于統計多圖譜配準優化的磁共振圖像腦子結構自動分割方法





