[發(fā)明專利]語音交互設(shè)備喚醒詞生成方法及裝置有效

申請(qǐng)?zhí)枺?/td>	201810550875.7	申請(qǐng)日：	2018-05-31
公開（公告）號(hào)：	CN108766420B	公開（公告）日：	2021-04-02
發(fā)明（設(shè)計(jì)）人：	劉馨靖	申請(qǐng)（專利權(quán)）人：	中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司
主分類號(hào)：	G10L15/06	分類號(hào)：	G10L15/06;G10L15/30
代理公司：	北京天昊聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 11112	代理人：	彭瑞欣;汪源
地址：	100033 ***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	語音交互設(shè)備喚醒生成方法裝置
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種語音交互設(shè)備喚醒詞生成方法，其特征在于，包括如下步驟：

服務(wù)器端預(yù)先存儲(chǔ)至少一個(gè)語音交互數(shù)據(jù)集合，以及每個(gè)所述語音交互數(shù)據(jù)集合對(duì)應(yīng)的喚醒詞；

所述服務(wù)器端將各個(gè)所述語音交互數(shù)據(jù)集合作為輸入，將其各自對(duì)應(yīng)的喚醒詞作為輸出，采用深度學(xué)習(xí)算法進(jìn)行訓(xùn)練，以得到喚醒詞模型；

所述服務(wù)器端接收用戶端發(fā)送的預(yù)設(shè)時(shí)間段內(nèi)用戶的語音交互數(shù)據(jù)；

所述服務(wù)器端將其從所述用戶端接收的所述語音交互數(shù)據(jù)輸入至所述喚醒詞模型以得到對(duì)應(yīng)的喚醒詞，并向所述用戶端發(fā)送所述喚醒詞，以使所述用戶端向所述用戶推送所述喚醒詞；

在所述服務(wù)器端預(yù)先存儲(chǔ)至少一個(gè)語音交互數(shù)據(jù)集合，以及每個(gè)所述語音交互數(shù)據(jù)集合對(duì)應(yīng)的喚醒詞的步驟之后還包括如下步驟：

所述服務(wù)器端對(duì)每個(gè)所述語音交互數(shù)據(jù)集合進(jìn)行預(yù)處理，以去掉每個(gè)所述語音交互數(shù)據(jù)集合中的無意義詞匯，并對(duì)每個(gè)所述語音交互數(shù)據(jù)集合中的各條語音交互數(shù)據(jù)進(jìn)行分詞處理；

則所述服務(wù)器端將各個(gè)所述語音交互數(shù)據(jù)集合作為輸入的步驟相應(yīng)為：

所述服務(wù)器端將預(yù)處理后的各個(gè)所述語音交互數(shù)據(jù)集合作為輸入；

所述服務(wù)器端接收所述用戶端發(fā)送的預(yù)設(shè)時(shí)間段內(nèi)用戶的語音交互數(shù)據(jù)的步驟還包括：

所述服務(wù)器端接收所述用戶端發(fā)送的用戶端標(biāo)識(shí)；

則所述服務(wù)器端向所述用戶端發(fā)送所述喚醒詞的步驟相應(yīng)為：

所述服務(wù)器端根據(jù)所述用戶端標(biāo)識(shí)向與之對(duì)應(yīng)的所述用戶端發(fā)送所述喚醒詞。

2.根據(jù)權(quán)利要求1所述的生成方法，其特征在于，

所述服務(wù)器端將預(yù)處理后的各個(gè)所述語音交互數(shù)據(jù)集合作為輸入，將其各自對(duì)應(yīng)的喚醒詞作為輸出，采用深度學(xué)習(xí)算法進(jìn)行訓(xùn)練，以得到喚醒詞模型的步驟具體包括：

所述服務(wù)器端根據(jù)預(yù)處理后的各個(gè)所述語音交互數(shù)據(jù)集合及其各自對(duì)應(yīng)的喚醒詞，分別構(gòu)建語音交互數(shù)據(jù)詞典和喚醒詞詞典；

所述服務(wù)器端根據(jù)所述語音交互數(shù)據(jù)詞典，將預(yù)處理后的各個(gè)所述語音交互數(shù)據(jù)集合中每條語音交互數(shù)據(jù)轉(zhuǎn)換為一個(gè)向量，從而將每個(gè)所述語音交互數(shù)據(jù)集合轉(zhuǎn)換為一個(gè)向量集合，以及根據(jù)所述喚醒詞詞典，將每個(gè)所述語音交互數(shù)據(jù)集合對(duì)應(yīng)的所述喚醒詞轉(zhuǎn)換為一個(gè)喚醒詞向量；

所述服務(wù)器端將每個(gè)所述向量集合作為一次輸入，將其對(duì)應(yīng)的喚醒詞向量作為輸出，采用神經(jīng)網(wǎng)絡(luò)算法對(duì)所有所述向量集合進(jìn)行迭代訓(xùn)練，從而得到所述喚醒詞模型。

3.根據(jù)權(quán)利要求1或2所述的生成方法，其特征在于，

在所述服務(wù)器端接收用戶端發(fā)送的預(yù)設(shè)時(shí)間段內(nèi)用戶的語音交互數(shù)據(jù)的步驟之后還包括如下步驟：

所述服務(wù)器端對(duì)其從所述用戶端接收的所述語音交互數(shù)據(jù)進(jìn)行預(yù)處理，以去掉所述語音交互數(shù)據(jù)中的無意義詞匯并進(jìn)行分詞處理；

則所述服務(wù)器端將其從所述用戶端接收的所述語音交互數(shù)據(jù)輸入至所述喚醒詞模型以得到對(duì)應(yīng)的喚醒詞的步驟相應(yīng)為：

所述服務(wù)器端將其從所述用戶端接收并經(jīng)過預(yù)處理的所述語音交互數(shù)據(jù)輸入至所述喚醒詞模型以得到對(duì)應(yīng)的喚醒詞。

4.根據(jù)權(quán)利要求1或2所述的生成方法，其特征在于，

在所述服務(wù)器端向所述用戶端發(fā)送所述喚醒詞的步驟之后還包括如下步驟：

所述服務(wù)器端通過所述用戶端接收所述用戶發(fā)送的喚醒詞反饋信息，所述喚醒詞反饋信息包括喚醒詞確認(rèn)信息和喚醒詞修正信息；

所述服務(wù)器端在接收到所述喚醒詞確認(rèn)信息時(shí)，保持所述喚醒詞不變；

所述服務(wù)器端在接收到所述喚醒詞修正信息時(shí)，繼續(xù)通過所述用戶端接收所述用戶發(fā)送的新喚醒詞，并將其對(duì)應(yīng)的原喚醒詞替換為所述新喚醒詞。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司，未經(jīng)中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201810550875.7/1.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：一種基于深度學(xué)習(xí)的非常態(tài)語音區(qū)別方法
下一篇：語音交互的方法及裝置

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識(shí)別；音頻分析或處理
G10L15-00 語音識(shí)別
G10L15-02 .語音識(shí)別的特征提取；識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識(shí)別系統(tǒng)，例如對(duì)說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】