[發明專利]一種導入人工智能超深度學習用于語音圖像識別的方法有效
| 申請號: | 201811249231.0 | 申請日: | 2018-10-25 |
| 公開(公告)號: | CN109087646B | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 韓青江 | 申請(專利權)人: | 武漢拓睿傳奇科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/02;G10L21/0208;H04L29/08;G06K9/62 |
| 代理公司: | 上海精晟知識產權代理有限公司 31253 | 代理人: | 馮子玲 |
| 地址: | 430000 湖北省武漢市東*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 導入 人工智能 深度 學習 用于 語音 圖像 識別 方法 | ||
本發明公開了一種導入人工智能超深度學習用于語音圖像識別的方法,包括觸摸屏、圖像識別模塊、語音識別模塊和CORTEX?A75處理器,述觸摸屏具有攝像頭、麥克風、程序儲存器、隨機儲存器數據、圖像識別模塊、語音識別模塊和CORTEX?A75處理器,所述圖像識別模塊包括攝像控制模塊和圖像對比模塊,所述攝像控制模塊包括圖像處理模塊和圖片傳輸模塊,所述語音識別模塊包括預處理系統、特征提取系統和模式匹配系統,且模式匹配系統內具有語言模型庫。人員通過本發明快速識別相應信息,且再識別過程中,可對錄入的語音信號進行減噪濾波處理,提高識別的精確性,能實現數據不斷更新和上傳云端,在擴大檢索的范圍和多樣化的同時,實現數據共享。
技術領域
本發明屬于語音圖像識別技術領域,具體涉及一種導入人工智能超深度學習用于語音圖像識別的方法。
背景技術
在圖像語音識別過程中,錄入的圖像或語音的資源存在在準確性上或資源檢索范圍上都存在較大的局限性,在沒有實現新數據創建下,且不存在大資源的共享學習更新,在語音識別上沒有對語音信號實現優化降噪濾波的處理,且因數據的局限,不能識別可能已出現的數據資源或將不相關的信號數據因未優化處理識別出錯誤的位置信息。
發明內容
本發明的目的在于提供一種導入人工智能超深度學習用于語音圖像識別的方法,以解決上述背景技術中提出的在圖像語音識別過程中,錄入的圖像或語音的資源存在在準確性上或資源檢索范圍上都存在較大的局限性,在沒有實現新數據創建下,且不存在大資源的共享學習更新,在語音識別上沒有對語音信號實現優化降噪濾波的處理,且因數據的局限,不能識別可能已出現的數據資源或將不相關的信號數據因未優化處理識別出錯誤的位置信息。
為實現上述目的,本發明提供如下技術方案:一種導入人工智能超深度學習用于語音圖像識別的模塊,包括觸摸屏、圖像識別模塊、語音識別模塊和CORTEX-A75處理器,所述觸摸屏具有攝像頭、麥克風、程序儲存器、隨機儲存器數據、圖像識別模塊、語音識別模塊和CORTEX-A75處理器,所述圖像識別模塊包括攝像控制模塊和圖像對比模塊,所述攝像控制模塊包括圖像處理模塊和圖片傳輸模塊,所述語音識別模塊包括預處理系統、特征提取系統和模式匹配系統,且模式匹配系統內具有語言模型庫,所述預處理系統電連接特征提取系統,且特征提取系統與模式匹配系統數據連接,實現語音數據識別,所述圖像識別模塊電連接攝像頭,所述語音識別模塊電連接麥克風,所述圖像識別模塊和語音識別模塊分別與CORTEX-A75處理器數據連接,且CORTEX-A75處理器與程序儲存器和隨機儲存器數據連接,實現圖像數據和語音數據的處理和存儲,所述CORTEX-A75處理器通過網絡控制器與云端服務器數據連接。
進一步地,所述麥克風具有多組,所述CORTEX-A75處理器通過網絡控制器與云端服務器數據連接,可定期實現更新程序儲存器、隨機儲存器的資源數據和語言模型庫,進而擴大人員圖像語音檢索的范圍,且利用CORTEX-A75處理器將處理后的圖片語音通過網絡控制器上傳于云端服務器,實現數據共享。
進一步地,所述預處理系統內具有反混疊失真濾波器、預加重器、端點檢測模塊和噪聲濾波器。
進一步地,所述特征提取系統具有LPC、LPCC、MFCC和ASCC。
與現有技術相比,本發明的有益效果是:可通過錄入的圖像或語音信號快速進入對應的信息數據的位置,便于人員通過本發明快速識別相應信息,且再識別過程中,可對錄入的語音信號進行減噪濾波處理,提高識別的精確性,能實現數據不斷更新和上傳云端,在擴大檢索的范圍和多樣化的同時,實現數據共享。
附圖說明
圖1為本發明一種導入人工智能超深度學習用于語音圖像識別的方法的處理流程示意圖。
圖2為本發明一種導入人工智能超深度學習用于語音圖像識別的方法的數據信號連接關系結構示意圖。
圖3為本發明一種導入人工智能超深度學習用于語音圖像識別的方法的圖像識別模塊的系統架構結構示意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢拓睿傳奇科技有限公司,未經武漢拓睿傳奇科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811249231.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種醫療軟管路徑監測及控制系統
- 下一篇:一種汽車顯示屏生產用屏幕檢測裝置





