[發(fā)明專利]語音識別的方法、裝置、設備和計算機可讀介質在審

申請?zhí)枺?/td>	202110342586.X	申請日：	2021-03-30
公開（公告）號：	CN113053362A	公開（公告）日：	2021-06-29
發(fā)明（設計）人：	周永吉;郭敏鴻;范會善;王煉;馬亮亮;章鈴娜;姜京京	申請（專利權）人：	建信金融科技有限責任公司
主分類號：	G10L15/02	分類號：	G10L15/02;G10L15/183;G10L15/26
代理公司：	中原信達知識產權代理有限責任公司 11219	代理人：	郭晗;趙迪
地址：	200120 上海市自由***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音識別方法裝置設備計算機可讀介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音識別的方法，其特征在于，包括：

將用戶語音輸入至聲學模型中；

所述聲學模型輸出用戶音素至語言模型中，所述語言模型輸出用戶文字序列；

通過詞典替換所述用戶文字序列中的文字，得到多個語音近似詞；

輸出所述多個語音近似詞，并基于接收到的指令和所述多個語音近似詞，確定所述用戶語音的輸出文字序列。

2.根據權利要求1所述語音識別的方法，其特征在于，所述將用戶語音輸入至聲學模型中之前，還包括：

對用戶原始語音進行濾波和分幀處理，得到所述用戶語音。

3.根據權利要求2所述語音識別的方法，其特征在于，所述用戶原始語音是通過移動終端或語音采集設備獲取的。

4.根據權利要求1所述語音識別的方法，其特征在于，所述將用戶語音輸入至聲學模型中，包括：

將預設時間段內的用戶語音輸入至聲學模型中。

5.根據權利要求4所述語音識別的方法，其特征在于，所述預設時間段是由用戶預先設置的。

6.根據權利要求1所述語音識別的方法，其特征在于，所述通過詞典替換所述用戶文字序列中的文字，得到多個語音近似詞，包括：

通過詞典替換所述用戶文字序列中的同音字和/或近音字，得到多個語音近似詞。

7.根據權利要求6所述語音識別的方法，其特征在于，所述通過詞典替換所述用戶文字序列中的同音字和/或近音字，得到多個語音近似詞，包括：

通過詞典替換所述用戶文字序列中的同音字和/或近音字；

在替換后的用戶文字序列中詞語中，剔除非常用詞語，得到多個語音近似詞。

8.根據權利要求6所述語音識別的方法，其特征在于，所述在替換后的用戶文字序列中詞語中，剔除非常用詞語，得到多個語音近似詞，包括：

遍歷替換后的用戶文字序列中詞語，采用常用詞語詞典剔除非常用詞語，得到多個語音近似詞。

9.根據權利要求1所述語音識別的方法，其特征在于，所述輸出所述多個語音近似詞，并基于接收到的指令和所述多個語音近似詞，確定所述用戶語音的輸出文字序列，包括：

輸出所述多個語音近似詞，并接收指令，所述指令包括所述多個語音近似詞中的一個或多個語音近似詞；

基于所述多個語音近似詞中的一個或多個語音近似詞和所述用戶文字序列，確定所述用戶語音的輸出文字序列。

10.根據權利要求9所述語音識別的方法，其特征在于，所述輸出所述多個語音近似詞，包括：

按照所述語音近似詞的使用頻率，輸出所述多個語音近似詞。

11.根據權利要求9所述語音識別的方法，其特征在于，所述接收的指令是用戶通過移動終端發(fā)送的。

12.根據權利要求9所述語音識別的方法，其特征在于，所述多個語音近似詞中的一個或多個近似詞是默認語音近似詞，所述默認語音近似詞是所述多個語音近似詞中采用預設規(guī)則確定的。

13.根據權利要求12所述語音識別的方法，其特征在于，所述預設規(guī)則包括應用場景和/或使用頻率。

14.根據權利要求9所述語音識別的方法，其特征在于，所述基于所述多個語音近似詞中的一個或多個語音近似詞和所述用戶文字序列，確定所述用戶語音的輸出文字序列，包括：

基于所述多個語音近似詞中的一個或多個語音近似詞，確定文字序列所使用的語音近似詞；

所述所使用的語音近似詞和所述用戶文字序列相結合，確定所述用戶語音的輸出文字序列。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于建信金融科技有限責任公司，未經建信金融科技有限責任公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110342586.X/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：輸電鐵塔零件加工自動計件系統(tǒng)及其自動計件方法
下一篇：一種電容結構、像素電路以及AMOLED顯示器件

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓練語音識別系統(tǒng)，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】