[發(fā)明專利]圖像理解中基于語義信息原型向量構(gòu)成及序參量重構(gòu)方法無效
| 申請?zhí)枺?/td> | 200810022375.2 | 申請日: | 2008-06-28 |
| 公開(公告)號: | CN101373518A | 公開(公告)日: | 2009-02-25 |
| 發(fā)明(設(shè)計)人: | 高雋;謝昭;張旭東;吳克偉;馮文剛 | 申請(專利權(quán))人: | 合肥工業(yè)大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 安徽合肥華信知識產(chǎn)權(quán)代理有限公司 | 代理人: | 余成俊 |
| 地址: | 230009*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 理解 基于 語義 信息 原型 向量 構(gòu)成 參量 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像理解、計算機視覺和協(xié)同學領(lǐng)域,特別是一種圖像理解中基于語義信息原型向量構(gòu)成及序參量重構(gòu)方法。
背景技術(shù)
圖像理解的直觀任務就是利用計算機對輸入場景及其目標區(qū)域進行建模、計算、分析和推理,形成完整的簡單的文字或圖像圖形化標記的輸出過程,讓計算機識別判斷場景中有什么物體,在什么位置,目標間的關(guān)系是什么等等,解決基本的“what-where”問題,而場景和目標的信息表示方法是研究各種算法的前提和基礎(chǔ)。近年來計算機視覺技術(shù)發(fā)展迅速,針對層出不窮的分類思想的學習判別方法及算法,通常預先對場景及其目標進行認知概念和類別劃分,形成不同的模式信息對應下的語義概念,再通過學習得到相關(guān)的模式識別結(jié)果,為圖像理解奠定了基礎(chǔ),但這些語義概念僅面向計算機的,缺乏人的認知信息,因此產(chǎn)生的結(jié)果不具備智能的理解描述能力,而僅僅是歸屬類別的判斷,而且語義信息非常有限,更缺乏語義間的關(guān)系描述。
語義化標記描述是數(shù)據(jù)與知識之間的轉(zhuǎn)換過程,常用的標記方法通過低層處理進行區(qū)域分割和線提取特性測量,形成區(qū)域線及其圖像特征中層數(shù)據(jù)庫,數(shù)據(jù)和知識的轉(zhuǎn)化和融合就是形成中層數(shù)據(jù)庫的過程。規(guī)則表示前件為區(qū)域的若干特征數(shù)據(jù),規(guī)則后件則是理解的標記描述,通常為若干名詞描述,標記的過程即是對規(guī)則的推理過程,只有事實庫中的內(nèi)容與規(guī)則的條件相匹配時,才能激活這條規(guī)則,當激活多條規(guī)則時,按解決沖突的策略只選擇其中一條。規(guī)則的剛性特性導致了其自身的局限性,隨語義信息規(guī)模呈指數(shù)增長的規(guī)則個數(shù),其存儲和處理能力都是NP問題。
總之,現(xiàn)有的圖像理解方法受場景和目標信息存儲和表示的制約,存在計算復雜度高、自學習能力弱、魯棒性不強、收斂緩慢等不足之處,尤其是缺乏語義信息及其關(guān)系的結(jié)構(gòu)描述,無法形成有效的先驗知識指導計算機對場景及其目標進行合理準確的識別和理解。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供圖像理解中基于語義信息原型向量構(gòu)成及序參量重構(gòu)方法,在圖像理解中產(chǎn)生融合廣泛語義信息的協(xié)同學原型向量表示,在其基礎(chǔ)上進行有效知識約簡和序參量重構(gòu),有利于進行知識指導下的圖像理解。
本發(fā)明的技術(shù)方案如下:
一種圖像理解中基于語義信息原型向量構(gòu)成及序參量重構(gòu)方法,其特征在于:它包括以下步驟:
(1)場景和目標語義信息的原型向量表示;
(2)場景與目標原型向量的結(jié)構(gòu)表示;
(3)場景與目標原型向量的約簡處理;
(4)場景和目標的序參量重構(gòu)。
所述的一種圖像理解中基于語義信息原型向量構(gòu)成及序參量重構(gòu)方法,其特征在于:步驟(1)中,圖像理解中場景和目標的原型向量可表示為vk={vks,vkd},其中vks是編碼表示的場景和目標的語義描述向量作為先驗信息,vkd則是場景和目標的特征描述向量;特征描述向量vkd包括場景和目標中顏色、紋理、形狀以及空間關(guān)系等視覺信息,各個特征描述向量之間具有編組特性,在不同環(huán)境中其圖像的特征顯著性也不相同,體現(xiàn)了特征描述向量表示的層次性;原型向量中的語義描述向量vks的編碼特性體現(xiàn)了圖像理解中對場景的描述和目標識別的指導,目標間的空間關(guān)系及目標本身的特性等先驗信息可促進場景分類;同樣場景類別的先驗知識可以驅(qū)動場景中目標識別。
所述的一種圖像理解中基于語義信息原型向量構(gòu)成及序參量重構(gòu)方法,其特征在于:步驟(2)中,包含語義描述向量vks的原型向量具有認知上的邏輯蘊含關(guān)系,對場景和目標的原型向量進行編碼,對編碼關(guān)聯(lián)形成復雜的樹狀網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)的同層分支形成logN位的編碼信息,N為分支個數(shù),網(wǎng)絡(luò)節(jié)點就是該節(jié)點與根結(jié)點路徑上所有表示信息的融合疊加,所述的樹狀網(wǎng)絡(luò)結(jié)構(gòu)包含邏輯意義上的繼承和延續(xù)關(guān)系,形成新的語義描述向量替換原型向量中的vks,形成包含樹狀網(wǎng)絡(luò)結(jié)構(gòu)信息的原型向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于合肥工業(yè)大學,未經(jīng)合肥工業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810022375.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種船舶建造中的肋板拉入方法
- 下一篇:固定式消防水槍座
- 同類專利
- 專利分類
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





