[發(fā)明專(zhuān)利]一種引入物體關(guān)系的圖像分類(lèi)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010195840.3 | 申請(qǐng)日: | 2020-03-19 |
| 公開(kāi)(公告)號(hào): | CN111414962B | 公開(kāi)(公告)日: | 2023-06-23 |
| 發(fā)明(設(shè)計(jì))人: | 秦永強(qiáng);張祥偉;宋亮;劉金露 | 申請(qǐng)(專(zhuān)利權(quán))人: | 創(chuàng)新奇智(重慶)科技有限公司 |
| 主分類(lèi)號(hào): | G06V10/764 | 分類(lèi)號(hào): | G06V10/764;G06V10/774;G06V10/40 |
| 代理公司: | 深圳珠峰知識(shí)產(chǎn)權(quán)代理有限公司 44899 | 代理人: | 黃偉 |
| 地址: | 400039 重慶市九龍坡區(qū)*** | 國(guó)省代碼: | 重慶;50 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 引入 物體 關(guān)系 圖像 分類(lèi) 方法 | ||
1.一種引入物體關(guān)系的圖像分類(lèi)方法,其特征在于,包括如下步驟:
步驟S1,通過(guò)注意力機(jī)制構(gòu)建輸入圖像上的各個(gè)物體間的關(guān)系;
步驟S2,基于所構(gòu)建的各所述物體間的所述關(guān)系在所述輸入圖像上對(duì)各所述物體進(jìn)行分類(lèi)標(biāo)注和位置標(biāo)注;
步驟S3,對(duì)所標(biāo)注的分類(lèi)特征圖和位置特征圖進(jìn)行采樣,并將采樣得到的特征圖作為注意力模型訓(xùn)練樣本,訓(xùn)練得到所述注意力模型;
步驟S4,通過(guò)所述注意力模型對(duì)所述輸入圖像進(jìn)行目標(biāo)分類(lèi)識(shí)別;
步驟S1中,所述注意力機(jī)制構(gòu)建的各所述物體間的所述關(guān)系通過(guò)以下公式(1)表達(dá):
公式(1)中,用于表示第n個(gè)待分類(lèi)的所述物體在所述輸入圖像上的視覺(jué)特征;
Wv表示一第一線性變換矩陣;
m用于表示所述輸入圖像上第m個(gè)待分類(lèi)的所述物體;
n用于表示所述輸入圖像上第n個(gè)待分類(lèi)的所述物體;
公式(1)中的wmn通過(guò)以下公式(2)表達(dá):
公式(2)中,通過(guò)以下公式(3)表達(dá):
公式(3)中,WK和WQ分別表示第二線性變換矩陣和第三線性變換矩陣;
用于表示第m個(gè)待分類(lèi)的所述物體在所述輸入圖像上的所述視覺(jué)特征;
用于表示對(duì)作WK線性變換;
用于表示對(duì)作WQ線性變換;
用于表示對(duì)和作內(nèi)積運(yùn)算;
dk用于表示各所述矩陣的維度;
公式(2)中,通過(guò)以下公式(4)表達(dá):
公式(4)中,WG表示第四線性變換矩陣;
用于表示第m個(gè)待分類(lèi)的所述物體在所述輸入圖像上的位置特征;
用于表示第n個(gè)待分類(lèi)的所述物體在所述輸入圖像上的所述位置特征;
εG為通過(guò)所述注意力機(jī)制將所述輸入圖像上的兩個(gè)所述物體相對(duì)的四維坐標(biāo)變換到高維空間后得到的一坐標(biāo)特征;
用于表示對(duì)εG作WG線性變換;
公式(2)中,
公式(2)中,
用于表示第k個(gè)待分類(lèi)的所述物體在所述輸入圖像上的所述視覺(jué)特征;
用于表示對(duì)作WK線性變換;
用于表示對(duì)作WQ線性變換;
用于表示對(duì)和作內(nèi)積運(yùn)算;
k用于表示所述輸入圖像上的第k個(gè)待分類(lèi)的所述物體。
2.如權(quán)利要求1所述的圖像分類(lèi)方法,其特征在于,所述四維坐標(biāo)表達(dá)如下:
xm和xn分別表示第m個(gè)待分類(lèi)的所述物體的圖像中心點(diǎn)和第n個(gè)待分類(lèi)的所述物體的圖像中心點(diǎn)在所述輸入圖像上的橫坐標(biāo);
ym和yn分別表示第m個(gè)待分類(lèi)的所述物體的圖像中心點(diǎn)和第n個(gè)待分類(lèi)的所述物體的圖像中心點(diǎn)在所述輸入圖像上的縱坐標(biāo);
wm表示第m個(gè)待分類(lèi)的所述物體的特征圖像的圖寬;
hm表示第m個(gè)待分類(lèi)的所述物體的所述特征圖像的圖高。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于創(chuàng)新奇智(重慶)科技有限公司,未經(jīng)創(chuàng)新奇智(重慶)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010195840.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 關(guān)系視圖
- 位置關(guān)系檢測(cè)裝置以及位置關(guān)系檢測(cè)系統(tǒng)
- 關(guān)系建模
- 關(guān)系分析方法、關(guān)系分析程序、以及關(guān)系分析裝置
- 實(shí)體關(guān)系分類(lèi)裝置和實(shí)體關(guān)系分類(lèi)方法
- 用戶關(guān)系抽取方法和用戶關(guān)系抽取系統(tǒng)
- 融合依存關(guān)系與篇章修辭關(guān)系的事件時(shí)序關(guān)系識(shí)別方法
- 開(kāi)關(guān)系統(tǒng)
- 視頻視覺(jué)關(guān)系檢測(cè)的關(guān)系片段連接方法
- 開(kāi)關(guān)系統(tǒng)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





