[發(fā)明專利]一種應用于手機端的深度學習圖像識別系統(tǒng)及實現方法有效
| 申請?zhí)枺?/td> | 201710054291.6 | 申請日: | 2017-01-22 |
| 公開(公告)號: | CN106778918B | 公開(公告)日: | 2020-10-30 |
| 發(fā)明(設計)人: | 黃萱昆;白洪亮;董遠 | 申請(專利權)人: | 蘇州飛搜科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 北京卓唐知識產權代理有限公司 11541 | 代理人: | 龔潔 |
| 地址: | 215123 江蘇省蘇州市蘇州工*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 手機 深度 學習 圖像 識別 系統(tǒng) 實現 方法 | ||
本發(fā)明公開了一種應用于手機端的深度學習圖像識別系統(tǒng)及實現方法,方法包括:根據概念劃分映射得到一樹狀類別映射關系;基于原始的Inception?v3網絡結構,在網絡中的降維處各增加一并聯(lián)分支作為網絡下一層的輸入得到改進的Inception?v3網絡結構;按照所述改進的Inception?v3網絡結構并在設定類上根據所述樹狀類別映射關系訓練得到基模型;對所述基模型進行壓縮后在手機端運行識別出圖像;所述壓縮至少包括:參數稀疏化、參數量化或者參數稀疏存儲中的一種。本發(fā)明中提供基于概念類別映射的樹狀圖像識別、并在算法上對原始Inception?v3模型結構做改進,同時提供了一種在不影響改進模型準確率情況下有效壓縮模型的方法,保證模型在手機端有效穩(wěn)定運行。
技術領域
本發(fā)明涉及手機端圖像識別技術,特別涉及一種應用于手機端的深度學習圖像識別系統(tǒng)及實現方法。
背景技術
圖像識別綜合了很多學科內容,其中包括計算機科學與技術、物理學、統(tǒng)計學以及神經生物學等,廣泛應用于地質勘探、圖像遙感、機器人視覺、生物醫(yī)學等多個領域。圖像識別技術在個人計算機以及嵌入式終端設備上也已有很多成熟的應用案例,而隨著手機功能的不斷增強,該技術也逐漸被應用到智能手機但智能手機本身的弱處理能力和低內存的局限性對計算復雜的識別算法提出了考驗。
目前智能手機發(fā)展非常迅速,基本上都集成高速處理芯片、大容量存儲器、內置了百萬像素的攝像頭和WI-FI無線局域網接口卡,甚至一些高端的設備中還集成了大量傳感器如GPS定位傳感器和加速度傳感器等這些性能不斷提高的硬件設備,給計算機視覺和圖像處理領域帶來了新的發(fā)展空間,許多原來運行在PC上的計算機視覺算法,通過改進和優(yōu)化,能有效的運行的智能終端的平臺上。但是,相對于現在配備高速處理芯片和大容量存儲芯片的服務器,智能手機還存在以下不足:較低的圖像分辨率、缺少專門的圖形加速器、沒有浮點運算單元、尤其是低端處理器和低容量存儲器等,限制了在智能手機上進行復雜運算和大規(guī)模計算
具體而言,現有的手機端圖像識別技術中具有較多實現方式,比如,手機端單層次的類別圖像識別,但缺點在于:類別數不夠豐富,也沒有表現類別之間的聯(lián)系。比如,用于分類的卷積神經網絡算法模型Inception-v3結構(相較于前一版本v3一個最重要的改進是分解(Factorization),將7x7分解成兩個一維的卷積(1x7,7x1),3x3也是一樣(1x3,3x1),這樣的好處,既可以加速計算(多余的計算能力可以用來加深網絡),又可以將1個conv拆成2個conv,使得網絡深度進一步增加,增加了網絡的非線性,還有值得注意的地方是網絡輸入從224x224變?yōu)榱?99x299,更加精細設計了35x35/17x17/8x8的模塊。),但缺點在于:在原始結構內有兩處直接一個Pooling層降維,容易造成一定的信息損失。比如,模型參數稀疏化,但缺點在于:直接用一個簡單的閾值去減參數,導致模型準確率有一定的損失。又比如,模型參數量化,但缺點在于:K-means聚類易受參數數量大小而影響效果,魯棒性不夠;改變量化中心的方式計算量大,訓練速度慢。再比如,模型參數稀疏存儲,但缺點在于:對所有卷積層使用同樣的比特位大小,存儲效率不高。
綜上,現如今的手機端圖像識別系統(tǒng)大多采用深度學習訓練得到的深度模型進行識別,但是如何有效率的展示圖像識別的結果、如何更加準確的識別圖像、同時還能在不影響模型識別準確率的情況下壓縮模型,減少模型存儲和計算量以適用于手機端,是有待解決的問題。
發(fā)明內容
本發(fā)明要解決的技術問題是,提供基于概念類別映射的樹狀圖像識別、并在算法上對原始Inception-v3模型結構做改進,同時提供了一種在不影響改進模型準確率情況下有效壓縮模型的方法,保證模型在手機端有效穩(wěn)定運行的深度學習圖像識別系統(tǒng)。
解決上述技術問題,本發(fā)明提供了一種應用于手機端的深度學習圖像識別方法,包括如下步驟:
根據概念劃分映射得到一樹狀類別映射關系;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州飛搜科技有限公司,未經蘇州飛搜科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710054291.6/2.html,轉載請聲明來源鉆瓜專利網。





