[發明專利]基于語義定義的目標識別網絡設計方法有效
| 申請號: | 201810465726.0 | 申請日: | 2018-05-16 |
| 公開(公告)號: | CN108764459B | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 石光明;謝雪梅;高大化;毛思穎;馬麗華 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/06 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 王品華 |
| 地址: | 710071 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 定義 目標 識別 網絡 設計 方法 | ||
本發明提出了一種基于語義定義的目標識別網絡設計方法,主要解決現有目標識別網絡需要大數據驅動,能耗高,費時間,泛化能力和遷移性弱的問題。其實現方案是:1.定義語義的層級化結構以及基于人類感覺的語義基元;2.根據人類初級視皮層V1的視覺神經元分別設計不同類型的可以執行不同功能的基層語義神經元,分別負責檢測水平線、垂直線、斜線、直線、弧線、三角形、四邊形、多邊形和顏色;3.按照需要識別目標的層級語義,逐層構建語義識別網絡;4.用語義識別網絡對圖片進行識別。本發明是基于腦啟發的,不需要大數據驅動,能耗低,并具有很高的泛化能力和遷移性,可用于對多種目標的識別。
技術領域
本發明屬于人工智能領域,主要涉及一種新的目標識別網絡,可用于對多類目標進行識別。
背景技術
當今信息技術的巨大進步推動著人工智能的基礎理論、方法和技術向縱深發展。隨著信息技術、大數據、深度學習,腦神經科學的巨大進步,推動著人工智能技術的再一次飛躍。人工智能正呈現出以信息和知識處理為主、與人類知識混合、能自主完成更多認知性工作等新特點。
近年來,隨著人工智能領域研究工作的快速發展,越來越多基于深度學習算法的神經網絡在計算機視覺、語音識別、自然語言處理等方面取得了優異成績,特別是在計算機視覺的目標識別領域,比如:VGGNet、InceptionNet、ResNet等網絡,它們都是使用較小的卷積核和較深的網絡結構。這些網絡雖然可以有效地提取到圖像的顯著性特征,在目標識別任務上也取得了很不錯的成績。但是,目前這些基于深度學習的目標識別網絡都是由一套共同的工作機制運行的,且只能用數學函數來刻畫約束規則,根據該約束規則,網絡才能通過前向傳播和反向調權進行精準計算,以擬合求出誤差最小的解,這套固定的工作模式會帶來如下幾個不足:
1.網絡的訓練依靠大數據驅動,需要大量的標注數據以及繁瑣的調參過程,且數據存儲和計算相互獨立,數據傳輸占很大比例,導致存儲及計算復雜,耗能很高。
2.網絡存在“難設計、難預期、難解釋”的三難問題。
3.網絡缺乏遷移學習和泛化能力,即只能完成單一任務而不是多任務,對于同一類物體在不同情況下的樣本適應能力差,比如做人臉識別的就只能識別人臉、并且針對正面的臉識別效果好,如果臉稍稍偏一點就無法識別或識別效果不好。
發明內容
本發明的目的在于提出一種基于語義定義的目標識別網絡設計方法,以解決上述現有目標識別網絡的不足,減小存儲、計算復雜度和耗能,提高遷移學習和泛化能力,實現快速有效的目標識別。
本發明的技術思想是:通過目標語義知識定義構造一個全新的網絡,以將人類獲得的目標信息直接注入到計算機幫助計算機識別目標。
根據上述思想,本發明基于語義定義的目標識別網絡設計方法,其特征在于:包括:
1)定義語義及語義基元:
語義是由多個子語義組合,每個子語義又由子子語義組合,以此類推,直至最底層的語義基元而構成的層級結構;
語義基元,是指視覺、聽覺、嗅覺、味覺、觸覺這幾種人類最基本的感覺信息;不同的語義基元之間存在關聯性;
2)設計各類基元濾波器:
2a)根據人類初級視皮層v1的神經元分別設計不同類型,并能執行不同功能的基元濾波器,用于對輸入的預處理圖像進行濾波,檢測出不同的視覺語義基元,該視覺語義基元包括:點、水平線、垂直線、斜線、弧線、三角形、四邊型、多邊形、圓、圓弧、顏色;
2b)根據基元濾波器與預處理圖像塊的匹配程度,使得基元濾波器的輸出為0或1,或0到1之間的某個小數,并轉換成相應幅值的脈沖輸入到下一層;
3)構建語義識別網絡:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810465726.0/2.html,轉載請聲明來源鉆瓜專利網。





