[發明專利]基于自然語言處理的語音識別方法、裝置、設備及介質在審
| 申請號: | 202110467540.0 | 申請日: | 2021-04-28 |
| 公開(公告)號: | CN113192497A | 公開(公告)日: | 2021-07-30 |
| 發明(設計)人: | 康海梅;魏韜;馬駿;王少軍 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/26;G10L15/02 |
| 代理公司: | 深圳市精英專利事務所 44242 | 代理人: | 涂年影 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自然語言 處理 語音 識別 方法 裝置 設備 介質 | ||
1.一種基于自然語言處理的語音識別方法,其特征在于,所述方法包括:
若接收到用戶輸入的語音信息,根據預置的音頻特征提取模型從所述語音信息中提取得到音頻特征信息;
根據預置的困惑網絡對所述音頻特征信息進行解析得到拼音信息及初始文本信息;
根據預置的轉換詞典分別對所述拼音信息及所述初始文本信息進行轉換得到對應的拼音編碼序列及初始字符編碼序列;
對所述拼音編碼序列及所述初始字符編碼序列進行疊加組合得到所述語音信息的組合編碼序列;
將所述組合編碼序列輸入預置的文本糾錯模型進行糾錯以得到對應的糾錯編碼序列;
根據所述轉換詞典對所述糾錯編碼序列進行逆轉換得到與所述語音信息對應的文本識別信息。
2.根據權利要求1所述的基于自然語言處理的語音識別方法,其特征在于,所述音頻特征提取模型包括頻譜轉換規則、頻率轉換公式及逆變換規則,所述根據預置的音頻特征提取模型從所述語音信息中提取得到音頻特征信息,包括:
對所述語音信息進行分幀處理得到對應的多幀音頻信息;
根據預置的單位時間及所述頻譜轉換規則將每一所述單位時間內包含的所述音頻信息轉換為對應的音頻頻譜;
根據所述頻率轉換公式將每一所述音頻頻譜轉換為對應的非線性音頻頻譜;
根據所述逆變換規則對每一所述非線性音頻頻譜進行逆變換得到與每一所述非線性音頻頻譜對應的多個音頻系數作為所述音頻特征信息。
3.根據權利要求1所述的基于自然語言處理的語音識別方法,其特征在于,所述根據預置的困惑網絡對所述音頻特征信息進行解析得到拼音信息及初始文本信息,包括:
根據所述困惑網絡中標準拼音信息與標準音頻特征信息的對應關系,獲取與所述音頻特征信息相匹配的一條拼音信息;
根據所述困惑網絡中標準拼音信息與字符之間的關聯關系,獲取所述困惑網絡中與所述拼音信息對應的字符串聯形成的多條可選文本信息;
計算所述困惑網絡中每一所述可選文本信息的路徑相似度,并從所述多條可選文本信息中獲取路徑相似度最高的一條可選文本信息作為初始文本信息。
4.根據權利要求1所述的基于自然語言處理的語音識別方法,其特征在于,所述對所述拼音編碼序列及所述初始字符編碼序列進行疊加組合得到所述語音信息的組合編碼序列,包括:
將所述拼音編碼序列中每一個拼音編碼值與所述字符編碼序列中對應的一個字符編碼值進行相加,得到對應的第一編碼序列;
將所述拼音編碼序列中每一個拼音編碼值與所述字符編碼序列中對應的一個字符編碼值進行順序拼接,得到對應的第二編碼序列;
將所述第一編碼序列與所述第二編碼序列進行組合作為對應的組合編碼序列。
5.根據權利要求1所述的基于自然語言處理的語音識別方法,其特征在于,所述根據預置的困惑網絡對所述音頻特征信息進行解析得到拼音信息及初始文本信息之前,還包括:
根據所述音頻特征提取模型分別從預存的標準數據集合包含的標準語音信息中提取得到對應的標準音頻特征信息;
從所述標準音頻特征信息中獲取所述標準數據集合的標準拼音信息中與每一字符拼音對應的標準音頻特征;
根據所述標準數據集合中的標準文本信息及所述標準音頻特征與每一所述字符拼音之間的關聯關系構建得到所述困惑網絡。
6.根據權利要求5所述的基于自然語言處理的語音識別方法,其特征在于,所述將所述組合編碼序列輸入預置的文本糾錯模型進行糾錯以得到對應的糾錯編碼序列之前,還包括:
根據所述音頻特征提取模型分別從預存的訓練數據集合包含的訓練語音信息中提取得到對應的訓練音頻特征信息;
根據所述困惑網絡對所述訓練音頻特征信息進行解析以獲取訓練拼音信息及訓練預測文本信息;
將所述訓練拼音信息及訓練預測文本信息與所述訓練數據集合中對應的訓練文本信息進行組合,得到模型訓練數據集合;
根據所述模型訓練數據集合對初始文本糾錯模型進行迭代訓練,得到訓練后的文本糾錯模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110467540.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種改性聚羧酸減水劑及其制備方法
- 下一篇:遠程監控智能投球裝置





