[發(fā)明專利]基于自然語(yǔ)言描述的視頻監(jiān)控行人搜索的注意力模型方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810844117.6 | 申請(qǐng)日: | 2018-07-27 |
| 公開(公告)號(hào): | CN109190471B | 公開(公告)日: | 2021-07-13 |
| 發(fā)明(設(shè)計(jì))人: | 冀中;李晟嘉 | 申請(qǐng)(專利權(quán))人: | 天津大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 杜文茹 |
| 地址: | 300072*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 自然語(yǔ)言 描述 視頻 監(jiān)控 行人 搜索 注意力 模型 方法 | ||
1.一種基于自然語(yǔ)言描述的視頻監(jiān)控行人搜索的注意力模型方法,其特征在于,包括如下步驟:
1)設(shè)由卷積神經(jīng)網(wǎng)絡(luò)提取的第n張圖像特征向量為In;第n張圖像對(duì)應(yīng)的自然語(yǔ)言描述中含有若干個(gè)單詞;第k個(gè)單詞的文本特征向量為圖像特征向量In和文本特征向量融合得到的融合向量為
2)將所述的融合向量輸入到全連接層中進(jìn)行訓(xùn)練,得到向量即:
其中,為融合向量的權(quán)重矩陣,為圖像特征向量In和文本特征向量所對(duì)應(yīng)的融合向量的偏置向量;
3)將向量輸入神經(jīng)網(wǎng)絡(luò)的Softmax層中進(jìn)行歸一化,并計(jì)算權(quán)重值Sn,將所有權(quán)重值作為元素構(gòu)成注意力向量即:
其中,注意力向量中共有j個(gè)元素xj,為注意力向量中第i個(gè)元素的權(quán)重;
4)將第k個(gè)單詞的文本特征向量為輸入到全連接層中進(jìn)行訓(xùn)練,得到向量即:
其中,為第n張圖像和第k個(gè)單詞對(duì)應(yīng)的文本特征向量的權(quán)重矩陣,為第n張圖像和第k個(gè)單詞對(duì)應(yīng)的文本特征向量的偏置向量;
5)將向量輸入神經(jīng)網(wǎng)絡(luò)的Softmax層中進(jìn)行歸一化,并計(jì)算權(quán)重值TSn,將所有權(quán)重值作為元素構(gòu)成注意力向量即
其中,注意力向量中共有j個(gè)元素zj,為注意力向量中第i個(gè)元素的權(quán)重;
6)將注意力向量與文本特征向量進(jìn)行內(nèi)積運(yùn)算,得到經(jīng)過注意力向量加權(quán)的標(biāo)量分?jǐn)?shù)--文本的重要程度即:
7)將注意力向量與第k個(gè)單詞的圖像特征向量進(jìn)行內(nèi)積運(yùn)算,得到經(jīng)過注意力向量加權(quán)的標(biāo)量分?jǐn)?shù)--文本與圖像之間的聯(lián)系程度即:
8)將聯(lián)系程度與重要程度進(jìn)行乘積運(yùn)算,得到注意力評(píng)價(jià)分?jǐn)?shù)Sco,即:
其中,注意力評(píng)價(jià)分?jǐn)?shù)是用于表示文本中每個(gè)單詞與圖像的相關(guān)程度,分?jǐn)?shù)越大,則每個(gè)單詞與圖像的相關(guān)程度越高。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810844117.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種自然語(yǔ)言的搜索方法及系統(tǒng)
- 基于交互上下文處理自然語(yǔ)言方法
- 計(jì)算機(jī)化的自然語(yǔ)言查詢意圖分派
- 自然語(yǔ)言描述信息的生成方法及裝置
- 風(fēng)格可定制的文本生成
- 多輪預(yù)制對(duì)話
- 改變應(yīng)答以提供表現(xiàn)豐富的自然語(yǔ)言對(duì)話的方法、計(jì)算機(jī)裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言查詢的轉(zhuǎn)換
- 一種自然語(yǔ)言處理方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 自然語(yǔ)言理解模型訓(xùn)練方法、自然語(yǔ)言理解方法及裝置





