[發(fā)明專利]語音輸入完整性判斷方法、裝置、電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110303267.8 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN113035180A | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設(shè)計)人: | 原道德 | 申請(專利權(quán))人: | 建信金融科技有限責任公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/22 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 200120 上海市浦東新區(qū)中國(*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 輸入 完整性 判斷 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
1.一種語音輸入完整性判斷方法,其特征在于,包括:
對用戶的當前輸入語音進行聲學(xué)特征提取操作,得到當前語音聲學(xué)特征;
對所述當前輸入語音進行語義特征提取操作,得到當前語音語義特征;
根據(jù)所述當前語音聲學(xué)特征和所述當前語音語義特征,得到當前語音輸入的完整性判斷結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,對所述當前輸入語音進行語義特征提取操作,得到當前語音語義特征,包括:
結(jié)合歷史對話信息對所述當前輸入語音進行語義特征提取操作,得到當前語音語義特征。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,結(jié)合歷史對話信息對所述當前輸入語音進行語義特征提取操作,得到當前語音語義特征,包括:
對所述當前輸入語音進行語音識別,得到當前語音識別結(jié)果;
根據(jù)所述當前語音識別結(jié)果和歷史對話信息,對所述當前輸入語音進行語義特征提取操作,得到當前語音語義特征。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)所述當前語音識別結(jié)果和歷史對話信息,對所述當前輸入語音進行語義特征提取操作,得到當前語音語義特征,包括:
將所述當前語音識別結(jié)果和歷史對話信息輸入預(yù)先訓(xùn)練的語義特征提取模型,進行語義特征提取操作,得到當前語音語義特征。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述語義特征提取模型是基于第一深度神經(jīng)網(wǎng)絡(luò)對第一語音樣本集進行訓(xùn)練得到。
6.根據(jù)權(quán)利要求2-3任一項所述的方法,其特征在于,所述歷史對話信息中包括如下至少一項:當前輪對話中用戶的歷史輸入語音、歷史語音識別結(jié)果、意圖識別結(jié)果和對話系統(tǒng)的歷史答復(fù)信息。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在得到當前語音輸入的完整性判斷結(jié)果之后,還包括:
根據(jù)所述完整性判斷結(jié)果為所述當前輸入語音設(shè)置對話狀態(tài)標識;
相應(yīng)的,根據(jù)所述對話狀態(tài)標識確定當前輪對話。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,對用戶的當前輸入語音進行聲學(xué)特征提取操作,得到當前語音聲學(xué)特征,包括:
將所述當前輸入語音輸入預(yù)先訓(xùn)練的聲學(xué)特征提取模型,進行聲學(xué)特征提取,得到當前語音聲學(xué)特征。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述聲學(xué)特征提取模型是基于第二深度神經(jīng)網(wǎng)絡(luò)對第二語音樣本集進行訓(xùn)練得到。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,語音聲學(xué)特征包括如下至少一項:頻域特征和基頻特征。
11.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述當前語音聲學(xué)特征和所述當前語音語義特征,得到當前語音輸入的完整性判斷結(jié)果,包括:
將所述當前語音聲學(xué)特征和所述當前語音語義特征,輸入預(yù)先訓(xùn)練的完整性判斷模型,得到當前語音輸入的完整性判斷結(jié)果。
12.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述完整性判斷模型是基于第三深度神經(jīng)網(wǎng)絡(luò)對第三語音樣本集進行訓(xùn)練得到。
13.一種語音輸入完整性判斷裝置,其特征在于,包括:
聲學(xué)特征提取模塊,用于對用戶的當前輸入語音進行聲學(xué)特征提取操作,得到當前語音聲學(xué)特征;
語義特征提取模塊,用于對所述當前輸入語音進行語義特征提取操作,得到當前語音語義特征;
完整性判斷模塊,用于根據(jù)所述當前語音聲學(xué)特征和所述當前語音語義特征,得到當前語音輸入的完整性判斷結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于建信金融科技有限責任公司,未經(jīng)建信金融科技有限責任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110303267.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





