[發(fā)明專利]借由聯(lián)合稀疏表示的屬性感知零樣本機器視覺系統(tǒng)在審
| 申請?zhí)枺?/td> | 201880052204.6 | 申請日: | 2018-07-12 |
| 公開(公告)號: | CN111052144A | 公開(公告)日: | 2020-04-21 |
| 發(fā)明(設(shè)計)人: | S·科洛瑞;M·羅斯塔米;金勁男;Y·奧維考 | 申請(專利權(quán))人: | 赫爾實驗室有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/62;G06K9/00 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 師瑋;王小東 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聯(lián)合 稀疏 表示 屬性 感知 樣本 機器 視覺 系統(tǒng) | ||
1.一種用于對象識別的系統(tǒng),該系統(tǒng)包括:
編碼有可執(zhí)行指令的非暫時性計算機可讀介質(zhì)以及一個或更多個處理器,使得當(dāng)執(zhí)行所述可執(zhí)行指令時,所述一個或更多個處理器執(zhí)行以下操作:
使用訓(xùn)練圖像集合和注釋的語義屬性,對模型進行訓(xùn)練,所述模型使用關(guān)于視覺特征和語義屬性的字典的聯(lián)合稀疏表示將來自已知圖像的視覺特征映射到所述注釋的語義屬性;
使用所訓(xùn)練的模型將未見過的輸入圖像的視覺特征映射到該未見過的輸入圖像的語義屬性;
將所述未見過的輸入圖像分類為屬于圖像類;以及
基于所述未見過的輸入圖像的分類來對裝置進行控制,其中,所述裝置是車輛部件,并且控制所述裝置導(dǎo)致車輛操縱。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述一個或更多個處理器進一步執(zhí)行以下操作:生成包括來自多個圖像類的對象圖像的訓(xùn)練圖像集合,其中,所述訓(xùn)練圖像集合中的各個對象圖像已經(jīng)用類標(biāo)簽和描述該對象圖像的語義屬性進行了注釋。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,為了訓(xùn)練所述模型,將視覺特征空間和語義屬性空間建模為非線性空間,所述非線性空間為視覺特征及其對應(yīng)的語義屬性提供完全相同的稀疏表示。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述一個或更多個處理器進一步執(zhí)行以下操作:
找到針對從所述未見過的輸入圖像中提取的視覺特征的稀疏表示;以及
生成在所述模型的所述語義屬性空間中解析的語義屬性預(yù)測,其中,軟分配概率向量標(biāo)識所述語義屬性預(yù)測屬于未見過的圖像的類的概率。
5.根據(jù)權(quán)利要求4所述的系統(tǒng),其中,使用正則化參數(shù)來調(diào)節(jié)所述軟分配概率向量的熵。
6.根據(jù)權(quán)利要求4所述的系統(tǒng),其中,在給定所述語義屬性預(yù)測的情況下,使用所述模型的所述語義屬性空間中的最接近的語義屬性的類標(biāo)簽來標(biāo)記所述未見過的輸入圖像。
7.一種用于對象識別的計算機實現(xiàn)的方法,該方法包括以下動作:
使一個或更多個處理器執(zhí)行編碼在非暫時性計算機可讀介質(zhì)上的指令,使得在執(zhí)行所述指令時,所述一個或更多個處理器執(zhí)行以下操作:
使用訓(xùn)練圖像集合和注釋的語義屬性,對模型進行訓(xùn)練,所述模型使用關(guān)于視覺特征和語義屬性的字典的聯(lián)合稀疏表示將來自已知圖像的視覺特征映射到所述注釋的語義屬性;
使用所訓(xùn)練的模型將未見過的輸入圖像的視覺特征映射到該未見過的輸入圖像的語義屬性;
將所述未見過的輸入圖像分類為屬于圖像類;以及
基于所述未見過的輸入圖像的分類來對裝置進行控制,其中,所述裝置是車輛部件,并且控制所述裝置導(dǎo)致車輛操縱。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述一個或更多個處理器進一步執(zhí)行以下操作:生成包括來自多個圖像類的對象圖像的訓(xùn)練圖像集合,其中,所述訓(xùn)練圖像集合中的各個對象圖像已經(jīng)用類標(biāo)簽和描述該對象圖像的語義屬性進行了注釋。
9.根據(jù)權(quán)利要求7所述的方法,其中,為了訓(xùn)練所述模型,將視覺特征空間和語義屬性空間建模為非線性空間,所述非線性空間為視覺特征及其對應(yīng)的語義屬性提供完全相同的稀疏表示。
10.根據(jù)權(quán)利要求7所述的方法,其中,所述一個或更多個處理器進一步執(zhí)行以下操作:
找到針對從所述未見過的輸入圖像中提取的視覺特征的稀疏表示;以及
生成在所述模型的所述語義屬性空間中解析的語義屬性預(yù)測,其中,軟分配概率向量標(biāo)識所述語義屬性預(yù)測屬于未見過的圖像的類的概率。
11.根據(jù)權(quán)利要求10所述的方法,其中,使用正則化參數(shù)來調(diào)節(jié)所述軟分配概率向量的熵。
12.根據(jù)權(quán)利要求10所述的方法,其中,在給定所述語義屬性預(yù)測的情況下,所述未見過的輸入圖像是使用所述模型的所述語義屬性空間中的最接近的語義屬性的類標(biāo)簽來標(biāo)記的。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于赫爾實驗室有限公司,未經(jīng)赫爾實驗室有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880052204.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:靜電圖像顯影用帶正電性調(diào)色劑
- 下一篇:信號處理裝置和工具
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 中繼網(wǎng)絡(luò)中的聯(lián)合方法、系統(tǒng)、中繼站及移動臺
- 中繼網(wǎng)絡(luò)中的聯(lián)合方法、系統(tǒng)、中繼站及移動臺
- 便攜信息終端、以及便攜信息終端的控制方法
- 電法與地震同步聯(lián)合反演方法及系統(tǒng)
- 銀行聯(lián)合放款的放款方法、裝置及計算機可讀存儲介質(zhì)
- 一種基于自主學(xué)習(xí)群搜索算法的聯(lián)合調(diào)度方法及系統(tǒng)
- 一種基于多目標(biāo)種群群搜索算法的聯(lián)合調(diào)度方法及系統(tǒng)
- 聯(lián)合貸款中的罰息與利息結(jié)算方法、裝置、介質(zhì)和設(shè)備
- 一種基坑支護用H型鋼構(gòu)件
- 用于云環(huán)境的語義元聯(lián)合代理





