[發(fā)明專利]一種信息處理方法及相關(guān)產(chǎn)品在審
| 申請?zhí)枺?/td> | 201711212994.3 | 申請日: | 2017-10-30 |
| 公開(公告)號: | CN107832844A | 公開(公告)日: | 2018-03-23 |
| 發(fā)明(設(shè)計)人: | 不公告發(fā)明人 | 申請(專利權(quán))人: | 上海寒武紀信息科技有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N3/04;G06N3/08;G06F9/38;G10L15/26 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司44202 | 代理人: | 郝傳鑫,熊永強 |
| 地址: | 200120 上海市浦*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 信息處理 方法 相關(guān) 產(chǎn)品 | ||
1.一種信息處理方法,其特征在于,應(yīng)用于計算裝置內(nèi),所述計算裝置包括通信單元以及運算單元,所述方法包括:
所述計算裝置控制所述通信單元獲取用戶輸入的待識別語音;
所述計算裝置控制所述運算單元獲取運算指令,以調(diào)用所述運算指令對所述待識別語音進行語音識別處理,從而獲得所述待識別語音所對應(yīng)的目標文本信息;
其中,所述運算指令為預(yù)先設(shè)置用于語音識別的指令。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計算裝置還包括寄存器單元以及控制器單元,所述計算裝置控制所述運算單元獲取運算指令,以調(diào)用所述運算指令對所述待識別語音進行語音識別處理,從而獲得所述待識別語音所對應(yīng)的目標文本信息包括:
所述計算裝置控制所述控制器單元從所述寄存器單元中提取第一運算指令以及網(wǎng)絡(luò)模型關(guān)聯(lián)的第二運算指令,并發(fā)送給所述運算單元;
所述計算裝置控制所述運算單元調(diào)用所述第一運算指令對所述待識別語音進行預(yù)處理,從而獲得待識別的中間語音,所述預(yù)處理包括時頻轉(zhuǎn)換;
所述計算裝置控制所述運算單元調(diào)用所述網(wǎng)絡(luò)模型關(guān)聯(lián)的第二運算指令對所述中間語音進行語音識別處理,從而獲得目標文本信息;
其中,所述網(wǎng)絡(luò)模型包括預(yù)置的神經(jīng)網(wǎng)絡(luò)模型或者非神經(jīng)網(wǎng)絡(luò)模型。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述第一運算指令為用于構(gòu)成時頻轉(zhuǎn)換算法的指令,所述時頻轉(zhuǎn)換算法包括以下中的至少一項:快速傅里葉變換算法、矩形窗算法、漢明窗算法以及神經(jīng)網(wǎng)絡(luò)算法。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述調(diào)用所述網(wǎng)絡(luò)模型關(guān)聯(lián)的第二運算指令對所述中間語音進行語音識別處理,從而獲得目標文本信息包括:
所述計算裝置控制所述運算單元調(diào)用所述網(wǎng)絡(luò)模型關(guān)聯(lián)的第二運算指令,對所述中間語音進行語音識別,從而獲得多個文本信息;
所述計算裝置控制所述運算單元調(diào)用第三運算指令,分別計算所述多個文本信息各自對應(yīng)的得分,以從多個得分中選取得分超過預(yù)設(shè)閾值的文本信息,作為所述目標文本信息。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,當所述網(wǎng)絡(luò)模型為神經(jīng)網(wǎng)絡(luò)模型時,所述神經(jīng)網(wǎng)絡(luò)模型包括以下功能層中的任一項或多項的組合:卷積運算層、池化pooling層、激活softmax層、批歸一化batch normalization層以及全連接層;其中,所述卷積運算層的運算是通過卷積運算指令實現(xiàn)的,所述pooling層的運算是通過pooling指令實現(xiàn)的,所述激活層的運算是通過激活指令實現(xiàn)的,所述batch normalization層的運算是通過batch normalization指令實現(xiàn)的,所述全連接層的運算是通過全連接指令實現(xiàn)的。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述計算裝置還包括數(shù)據(jù)訪問單元和存儲介質(zhì),
所述計算裝置控制所述運算單元將所述目標文本信息發(fā)送給所述數(shù)據(jù)訪問單元,以存儲至所述存儲介質(zhì)中。
7.根據(jù)權(quán)利要求1-6中任一項所述的方法,其特征在于,所述運算單元包括通過互聯(lián)模塊互聯(lián)的主運算模塊以及多個從運算模塊,所述運算指令為卷積運算指令時,
所述調(diào)用所述運算指令對所述待識別語音進行語音識別處理包括:
所述計算裝置控制所述從運算模塊實現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)算法中的輸入數(shù)據(jù)和卷積核的卷積運算,所述輸入數(shù)據(jù)為所述待識別語音,所述卷積神經(jīng)網(wǎng)絡(luò)算法與所述卷積運算指令對應(yīng);
所述計算裝置控制所述互聯(lián)模塊實現(xiàn)所述主運算模塊與所述從運算模塊之前的數(shù)據(jù)傳輸,在神經(jīng)網(wǎng)絡(luò)全連接層正向運算開始之前,所述主運算模塊通過互聯(lián)模塊將所述輸入數(shù)據(jù)發(fā)送給每個從運算模塊,在從運算模塊計算結(jié)束后,互聯(lián)模塊逐級將各個從運算模塊的輸出標量拼成中間向量,并返回給主運算模塊;
所述計算裝置控制所述主運算模塊將所有輸入數(shù)據(jù)對應(yīng)的中間向量拼接成中間結(jié)果,并對所述中間結(jié)果執(zhí)行后續(xù)運算。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述對所述中間結(jié)果執(zhí)行后續(xù)運算包括:
所述計算裝置控制所述主運算模塊將中間結(jié)果與偏置數(shù)據(jù)相加,然后執(zhí)行激活操作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海寒武紀信息科技有限公司,未經(jīng)上海寒武紀信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711212994.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





