[發(fā)明專利]語音識別的方法、裝置、電子設備和可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110522510.5 | 申請日: | 2021-05-13 |
| 公開(公告)號: | CN113327602A | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設計)人: | 郭啟行;崔亞峰 | 申請(專利權)人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16;G10L15/30;H04L12/26 |
| 代理公司: | 北京鴻德海業(yè)知識產(chǎn)權代理有限公司 11412 | 代理人: | 田宏賓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 電子設備 可讀 存儲 介質(zhì) | ||
1.一種語音識別的方法,包括:
獲取終端設備與服務器端進行數(shù)據(jù)傳輸時的網(wǎng)絡數(shù)據(jù);
根據(jù)所述網(wǎng)絡數(shù)據(jù)得到至少一種網(wǎng)絡特征;
將所述至少一種網(wǎng)絡特征輸入預先訓練得到的預測模型,得到所述預測模型輸出的預測結果;
在確定所述預測結果滿足預設要求的情況下,將所述終端設備的識別方式切換為離線識別以進行語音識別。
2.根據(jù)權利要求1所述的方法,其中,所述獲取終端設備與服務器端進行數(shù)據(jù)傳輸時的網(wǎng)絡數(shù)據(jù)包括:
以預設的時間間隔,獲取終端設備與服務器端進行數(shù)據(jù)傳輸時的網(wǎng)絡數(shù)據(jù)。
3.根據(jù)權利要求1所述的方法,其中,所述根據(jù)所述網(wǎng)絡數(shù)據(jù)得到至少一種網(wǎng)絡特征包括:
根據(jù)所述網(wǎng)絡數(shù)據(jù)得到預設類型的網(wǎng)絡特征。
4.根據(jù)權利要求1所述的方法,還包括,采用以下方式預先訓練得到所述預測模型:
獲取訓練數(shù)據(jù),所述訓練數(shù)據(jù)中包含多個網(wǎng)絡場景、多個網(wǎng)絡場景的網(wǎng)絡特征與多個網(wǎng)絡場景的標簽;
使用多個網(wǎng)絡場景的網(wǎng)絡特征與多個網(wǎng)絡場景的標簽對神經(jīng)網(wǎng)絡模型進行訓練,直至所述神經(jīng)網(wǎng)絡模型收斂,得到所述預測模型。
5.根據(jù)權利要求1所述的方法,還包括,
在將所述終端設備的識別方式切換為離線識別以進行語音識別之后,在確定完成語音識別的情況下,將所述終端設備的識別模式切換為在線識別。
6.一種語音識別的裝置,包括:
獲取單元,用于獲取終端設備與服務器端進行數(shù)據(jù)傳輸時的網(wǎng)絡數(shù)據(jù);
處理單元,用于根據(jù)所述網(wǎng)絡數(shù)據(jù)得到至少一種網(wǎng)絡特征;
預測單元,用于將所述至少一種網(wǎng)絡特征輸入預先訓練得到的預測模型,得到所述預測模型輸出的預測結果;
切換單元,用于在確定所述預測結果滿足預設要求的情況下,將所述終端設備的識別方式切換為離線識別以進行語音識別。
7.根據(jù)權利要求6所述的裝置,其中,所述獲取單元在獲取終端設備與服務器端進行數(shù)據(jù)傳輸時的網(wǎng)絡數(shù)據(jù)時,具體執(zhí)行:
以預設的時間間隔,獲取終端設備與服務器端進行數(shù)據(jù)傳輸時的網(wǎng)絡數(shù)據(jù)。
8.根據(jù)權利要求6所述的裝置,其中,所述處理單元在根據(jù)所述網(wǎng)絡數(shù)據(jù)得到至少一種網(wǎng)絡特征時,具體執(zhí)行:
根據(jù)所述網(wǎng)絡數(shù)據(jù)得到預設類型的網(wǎng)絡特征。
9.根據(jù)權利要求6所述的裝置,還包括訓練單元,用于采用以下方式預先訓練得到所述預測模型:
獲取訓練數(shù)據(jù),所述訓練數(shù)據(jù)中包含多個網(wǎng)絡場景、多個網(wǎng)絡場景的網(wǎng)絡特征與多個網(wǎng)絡場景的標簽;
使用多個網(wǎng)絡場景的網(wǎng)絡特征與多個網(wǎng)絡場景的標簽對神經(jīng)網(wǎng)絡模型進行訓練,直至所述神經(jīng)網(wǎng)絡模型收斂,得到所述預測模型。
10.根據(jù)權利要求6所述的裝置,所述切換單元還用于執(zhí)行,
在將所述終端設備的識別方式切換為離線識別以進行語音識別之后,在確定完成語音識別的情況下,將所述終端設備的識別模式切換為在線識別。
11.一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行權利要求1-5中任一項所述的方法。
12.一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),其中,所述計算機指令用于使所述計算機執(zhí)行權利要求1-5中任一項所述的方法。
13.一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)權利要求1-5中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110522510.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





