[發(fā)明專利]對象的口語評測方法和裝置、存儲介質(zhì)和電子裝置在審
| 申請?zhí)枺?/td> | 202010871713.0 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN111986680A | 公開(公告)日: | 2020-11-24 |
| 發(fā)明(設(shè)計)人: | 余浩;徐燦;魯文斌 | 申請(專利權(quán))人: | 天津洪恩完美未來教育科技有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L21/0208;G10L25/60 |
| 代理公司: | 北京華夏泰和知識產(chǎn)權(quán)代理有限公司 11662 | 代理人: | 劉曉燕 |
| 地址: | 301700 天津市武清區(qū)京*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 對象 口語 評測 方法 裝置 存儲 介質(zhì) 電子 | ||
1.一種對象的口語評測方法,其特征在于,包括:
獲取目標(biāo)對象的目標(biāo)聲紋特征和待評測語音數(shù)據(jù)的第一語音特征,其中,所述待評測語音數(shù)據(jù)為對所述目標(biāo)對象進(jìn)行口語評測所使用的語音數(shù)據(jù);
根據(jù)所述目標(biāo)聲紋特征和所述第一語音特征,確定所述待評測語音數(shù)據(jù)中所述目標(biāo)對象的目標(biāo)語音邊界;
按照所述目標(biāo)語音邊界,從所述待評測語音數(shù)據(jù)中獲取屬于所述目標(biāo)對象的第一語音數(shù)據(jù);
使用所述第一語音數(shù)據(jù)對所述目標(biāo)對象進(jìn)行口語評測,得到所述目標(biāo)對象的目標(biāo)評測結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取目標(biāo)對象的目標(biāo)聲紋特征和待評測語音數(shù)據(jù)的第一語音特征包括:
從聲紋庫中提取出所述目標(biāo)對象的所述目標(biāo)聲紋特征,其中,所述聲紋庫中保存有多個對象的聲紋特征,所述多個對象包括所述目標(biāo)對象;
提取所述待評測語音數(shù)據(jù)的語音特征,得到所述第一語音特征。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,在所述從聲紋庫中提取出所述目標(biāo)對象的所述目標(biāo)聲紋特征之前,所述方法還包括:
通過所述目標(biāo)對象的客戶端顯示注冊提示信息,其中,注冊提示信息用于提示所述目標(biāo)對象注冊聲紋;
接收所述客戶端返回的第二語音數(shù)據(jù),其中,所述第二語音數(shù)據(jù)為所述目標(biāo)對象響應(yīng)所述注冊提示信息所輸入的語音數(shù)據(jù);
提取所述第二語音數(shù)據(jù)的聲紋特征,得到所述目標(biāo)聲紋特征;
將所述目標(biāo)聲紋特征保存到所述聲紋庫中。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述目標(biāo)聲紋特征和所述第一語音特征,確定所述待評測語音數(shù)據(jù)中所述目標(biāo)對象的目標(biāo)語音邊界包括:
將所述目標(biāo)聲紋特征和所述第一語音特征輸入到目標(biāo)聲音活動檢測模型,得到所述目標(biāo)聲音活動檢測模型輸出的所述目標(biāo)語音邊界,其中,所述目標(biāo)聲音活動檢測模型是使用訓(xùn)練對象的聲紋特征和訓(xùn)練語音數(shù)據(jù)的語音特征對初始聲音活動檢測模型進(jìn)行訓(xùn)練得到的,所述訓(xùn)練語音數(shù)據(jù)為標(biāo)注了所述訓(xùn)練對象的語音邊界的語音數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述將所述目標(biāo)聲紋特征和所述第一語音特征輸入到目標(biāo)聲音活動檢測模型,得到所述目標(biāo)聲音活動檢測模型輸出的所述目標(biāo)語音邊界包括:
將所述目標(biāo)聲紋特征和所述第一語音特征輸入到所述目標(biāo)聲音活動檢測模型,得到所述目標(biāo)聲音活動檢測模型確定的、所述待評測語音數(shù)據(jù)中的每個語音幀屬于所述目標(biāo)對象的概率;
確定所述待評測語音數(shù)據(jù)中屬于所述目標(biāo)對象的第一語音幀,其中,所述第一語音幀為所述待評測語音數(shù)據(jù)中屬于所述目標(biāo)對象的概率大于或者等于目標(biāo)概率閾值的語音幀;
根據(jù)所述第一語音幀,輸出所述待評測語音數(shù)據(jù)中所述目標(biāo)對象的所述目標(biāo)語音邊界。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述根據(jù)所述目標(biāo)聲紋特征和所述第一語音特征,確定所述待評測語音數(shù)據(jù)中所述目標(biāo)對象的目標(biāo)語音邊界之前,所述方法還包括:
獲取所述訓(xùn)練對象的聲紋特征和所述訓(xùn)練語音數(shù)據(jù)的語音特征;
根據(jù)所述訓(xùn)練語音數(shù)據(jù)中所述訓(xùn)練對象的語音邊界,確定第二語音幀和第三語音幀,其中,所述第二語音幀為所述訓(xùn)練語音數(shù)據(jù)中屬于所述訓(xùn)練對象的語音幀,所述第三語音幀為所述訓(xùn)練語音數(shù)據(jù)中除了所述第二語音幀以外的其他語音幀;
將所述訓(xùn)練對象的聲紋特征和所述訓(xùn)練語音數(shù)據(jù)的語音特征輸入到所述初始聲音活動檢測模型,得到所述初始聲音活動檢測模型輸出的、所述訓(xùn)練語音數(shù)據(jù)中的每個語音幀屬于所述訓(xùn)練對象的概率;
調(diào)整所述初始聲音活動檢測模型的模型參數(shù),得到所述目標(biāo)聲音活動檢測模型,其中,所述目標(biāo)聲音活動檢測模型輸出的所述第二語音幀屬于所述訓(xùn)練對象的概率大于或者等于目標(biāo)概率閾值、且所述第三語音幀屬于所述訓(xùn)練對象的概率小于所述目標(biāo)概率閾值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津洪恩完美未來教育科技有限公司,未經(jīng)天津洪恩完美未來教育科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010871713.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





