[發(fā)明專利]語音識別的方法、裝置、設備和計算機可讀介質在審
| 申請?zhí)枺?/td> | 202110342586.X | 申請日: | 2021-03-30 |
| 公開(公告)號: | CN113053362A | 公開(公告)日: | 2021-06-29 |
| 發(fā)明(設計)人: | 周永吉;郭敏鴻;范會善;王煉;馬亮亮;章鈴娜;姜京京 | 申請(專利權)人: | 建信金融科技有限責任公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/183;G10L15/26 |
| 代理公司: | 中原信達知識產權代理有限責任公司 11219 | 代理人: | 郭晗;趙迪 |
| 地址: | 200120 上海市自由*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 設備 計算機 可讀 介質 | ||
1.一種語音識別的方法,其特征在于,包括:
將用戶語音輸入至聲學模型中;
所述聲學模型輸出用戶音素至語言模型中,所述語言模型輸出用戶文字序列;
通過詞典替換所述用戶文字序列中的文字,得到多個語音近似詞;
輸出所述多個語音近似詞,并基于接收到的指令和所述多個語音近似詞,確定所述用戶語音的輸出文字序列。
2.根據權利要求1所述語音識別的方法,其特征在于,所述將用戶語音輸入至聲學模型中之前,還包括:
對用戶原始語音進行濾波和分幀處理,得到所述用戶語音。
3.根據權利要求2所述語音識別的方法,其特征在于,所述用戶原始語音是通過移動終端或語音采集設備獲取的。
4.根據權利要求1所述語音識別的方法,其特征在于,所述將用戶語音輸入至聲學模型中,包括:
將預設時間段內的用戶語音輸入至聲學模型中。
5.根據權利要求4所述語音識別的方法,其特征在于,所述預設時間段是由用戶預先設置的。
6.根據權利要求1所述語音識別的方法,其特征在于,所述通過詞典替換所述用戶文字序列中的文字,得到多個語音近似詞,包括:
通過詞典替換所述用戶文字序列中的同音字和/或近音字,得到多個語音近似詞。
7.根據權利要求6所述語音識別的方法,其特征在于,所述通過詞典替換所述用戶文字序列中的同音字和/或近音字,得到多個語音近似詞,包括:
通過詞典替換所述用戶文字序列中的同音字和/或近音字;
在替換后的用戶文字序列中詞語中,剔除非常用詞語,得到多個語音近似詞。
8.根據權利要求6所述語音識別的方法,其特征在于,所述在替換后的用戶文字序列中詞語中,剔除非常用詞語,得到多個語音近似詞,包括:
遍歷替換后的用戶文字序列中詞語,采用常用詞語詞典剔除非常用詞語,得到多個語音近似詞。
9.根據權利要求1所述語音識別的方法,其特征在于,所述輸出所述多個語音近似詞,并基于接收到的指令和所述多個語音近似詞,確定所述用戶語音的輸出文字序列,包括:
輸出所述多個語音近似詞,并接收指令,所述指令包括所述多個語音近似詞中的一個或多個語音近似詞;
基于所述多個語音近似詞中的一個或多個語音近似詞和所述用戶文字序列,確定所述用戶語音的輸出文字序列。
10.根據權利要求9所述語音識別的方法,其特征在于,所述輸出所述多個語音近似詞,包括:
按照所述語音近似詞的使用頻率,輸出所述多個語音近似詞。
11.根據權利要求9所述語音識別的方法,其特征在于,所述接收的指令是用戶通過移動終端發(fā)送的。
12.根據權利要求9所述語音識別的方法,其特征在于,所述多個語音近似詞中的一個或多個近似詞是默認語音近似詞,所述默認語音近似詞是所述多個語音近似詞中采用預設規(guī)則確定的。
13.根據權利要求12所述語音識別的方法,其特征在于,所述預設規(guī)則包括應用場景和/或使用頻率。
14.根據權利要求9所述語音識別的方法,其特征在于,所述基于所述多個語音近似詞中的一個或多個語音近似詞和所述用戶文字序列,確定所述用戶語音的輸出文字序列,包括:
基于所述多個語音近似詞中的一個或多個語音近似詞,確定文字序列所使用的語音近似詞;
所述所使用的語音近似詞和所述用戶文字序列相結合,確定所述用戶語音的輸出文字序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于建信金融科技有限責任公司,未經建信金融科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110342586.X/1.html,轉載請聲明來源鉆瓜專利網。





