[發明專利]語音識別裝置和拾音設備在審

申請號：	202110963369.2	申請日：	2021-08-20
公開（公告）號：	CN113611296A	公開（公告）日：	2021-11-05
發明（設計）人：	王志軍;崔浩然;周天甲	申請（專利權）人：	天津訊飛極智科技有限公司
主分類號：	G10L15/16	分類號：	G10L15/16;G10L15/06;G11C7/16
代理公司：	北京路浩知識產權代理有限公司 11002	代理人：	程琛
地址：	300300 天津市濱海新區自貿試***	國省代碼：	天津;12
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別裝置設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明提供一種語音識別裝置和拾音設備，其中語音識別裝置包括CPU和NPU，CPU和NPU通信連接，NPU上加載有語音識別模型，語音識別模型基于樣本音頻和樣本音頻的識別文本訓練得到；CPU用于確定待識別音頻；NPU用于運行語音識別模型，確定待識別音頻的語音識別結果，將語音識別結果傳輸至CPU。本發明提供的語音識別裝置和拾音設備，結合NPU的強大算力，在語音識別裝置中部署了本地的語音識別模型，基于該語音識別模型對待識別音頻進行離線語音識別，從而實現了高可靠度和高識別效率的本地離線識別，本地離線識別無需依賴網絡，數據更加安全，也不存在網絡傳輸帶來的延時問題，識別顯示更加及時流暢，有助于優化用戶體驗。

技術領域

本發明涉及人工智能技術領域，尤其涉及一種語音識別裝置和拾音設備。

背景技術

錄音筆憑借攜帶方便、操作簡單等優點，被廣泛應用于會議、演講記錄、采訪和課堂等場合。

然而，目前市面上的主流錄音筆為傳統錄音筆，傳統錄音筆專注于錄音本身，錄音后需要用戶自主將聲音整理成文字，效率低下，而且重復的工作量很大。另外，部分錄音筆通過把錄音文件導出后，依托網絡引擎進行識別，步驟復雜，體驗不佳，而且安全風險也較高。

發明內容

本發明提供一種語音識別裝置和拾音設備，用以解決現有技術中識別效率低下的問題。

本發明提供一種語音識別裝置，包括中央處理器CPU和嵌入式神經網絡處理器NPU，所述CPU和所述NPU通信連接，所述NPU上加載有語音識別模型，所述語音識別模型基于樣本音頻和所述樣本音頻的識別文本訓練得到；

所述CPU用于確定待識別音頻；

所述NPU用于運行所述語音識別模型，確定所述待識別音頻的語音識別結果，并將所述語音識別結果傳輸至所述CPU。

根據本發明提供的一種語音識別裝置，所述NPU具體用于：

運行所述語音識別模型中的聲學模型，確定所述待識別音頻的聲學特征，并基于所述聲學特征確定所述待識別音頻的聲學語音識別結果，所述聲學模型是對云端聲學模型進行知識蒸餾得到的。