[發(fā)明專利]語音交互設(shè)備喚醒詞生成方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201810550875.7 | 申請(qǐng)日: | 2018-05-31 |
| 公開(公告)號(hào): | CN108766420B | 公開(公告)日: | 2021-04-02 |
| 發(fā)明(設(shè)計(jì))人: | 劉馨靖 | 申請(qǐng)(專利權(quán))人: | 中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司 |
| 主分類號(hào): | G10L15/06 | 分類號(hào): | G10L15/06;G10L15/30 |
| 代理公司: | 北京天昊聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 11112 | 代理人: | 彭瑞欣;汪源 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 交互 設(shè)備 喚醒 生成 方法 裝置 | ||
1.一種語音交互設(shè)備喚醒詞生成方法,其特征在于,包括如下步驟:
服務(wù)器端預(yù)先存儲(chǔ)至少一個(gè)語音交互數(shù)據(jù)集合,以及每個(gè)所述語音交互數(shù)據(jù)集合對(duì)應(yīng)的喚醒詞;
所述服務(wù)器端將各個(gè)所述語音交互數(shù)據(jù)集合作為輸入,將其各自對(duì)應(yīng)的喚醒詞作為輸出,采用深度學(xué)習(xí)算法進(jìn)行訓(xùn)練,以得到喚醒詞模型;
所述服務(wù)器端接收用戶端發(fā)送的預(yù)設(shè)時(shí)間段內(nèi)用戶的語音交互數(shù)據(jù);
所述服務(wù)器端將其從所述用戶端接收的所述語音交互數(shù)據(jù)輸入至所述喚醒詞模型以得到對(duì)應(yīng)的喚醒詞,并向所述用戶端發(fā)送所述喚醒詞,以使所述用戶端向所述用戶推送所述喚醒詞;
在所述服務(wù)器端預(yù)先存儲(chǔ)至少一個(gè)語音交互數(shù)據(jù)集合,以及每個(gè)所述語音交互數(shù)據(jù)集合對(duì)應(yīng)的喚醒詞的步驟之后還包括如下步驟:
所述服務(wù)器端對(duì)每個(gè)所述語音交互數(shù)據(jù)集合進(jìn)行預(yù)處理,以去掉每個(gè)所述語音交互數(shù)據(jù)集合中的無意義詞匯,并對(duì)每個(gè)所述語音交互數(shù)據(jù)集合中的各條語音交互數(shù)據(jù)進(jìn)行分詞處理;
則所述服務(wù)器端將各個(gè)所述語音交互數(shù)據(jù)集合作為輸入的步驟相應(yīng)為:
所述服務(wù)器端將預(yù)處理后的各個(gè)所述語音交互數(shù)據(jù)集合作為輸入;
所述服務(wù)器端接收所述用戶端發(fā)送的預(yù)設(shè)時(shí)間段內(nèi)用戶的語音交互數(shù)據(jù)的步驟還包括:
所述服務(wù)器端接收所述用戶端發(fā)送的用戶端標(biāo)識(shí);
則所述服務(wù)器端向所述用戶端發(fā)送所述喚醒詞的步驟相應(yīng)為:
所述服務(wù)器端根據(jù)所述用戶端標(biāo)識(shí)向與之對(duì)應(yīng)的所述用戶端發(fā)送所述喚醒詞。
2.根據(jù)權(quán)利要求1所述的生成方法,其特征在于,
所述服務(wù)器端將預(yù)處理后的各個(gè)所述語音交互數(shù)據(jù)集合作為輸入,將其各自對(duì)應(yīng)的喚醒詞作為輸出,采用深度學(xué)習(xí)算法進(jìn)行訓(xùn)練,以得到喚醒詞模型的步驟具體包括:
所述服務(wù)器端根據(jù)預(yù)處理后的各個(gè)所述語音交互數(shù)據(jù)集合及其各自對(duì)應(yīng)的喚醒詞,分別構(gòu)建語音交互數(shù)據(jù)詞典和喚醒詞詞典;
所述服務(wù)器端根據(jù)所述語音交互數(shù)據(jù)詞典,將預(yù)處理后的各個(gè)所述語音交互數(shù)據(jù)集合中每條語音交互數(shù)據(jù)轉(zhuǎn)換為一個(gè)向量,從而將每個(gè)所述語音交互數(shù)據(jù)集合轉(zhuǎn)換為一個(gè)向量集合,以及根據(jù)所述喚醒詞詞典,將每個(gè)所述語音交互數(shù)據(jù)集合對(duì)應(yīng)的所述喚醒詞轉(zhuǎn)換為一個(gè)喚醒詞向量;
所述服務(wù)器端將每個(gè)所述向量集合作為一次輸入,將其對(duì)應(yīng)的喚醒詞向量作為輸出,采用神經(jīng)網(wǎng)絡(luò)算法對(duì)所有所述向量集合進(jìn)行迭代訓(xùn)練,從而得到所述喚醒詞模型。
3.根據(jù)權(quán)利要求1或2所述的生成方法,其特征在于,
在所述服務(wù)器端接收用戶端發(fā)送的預(yù)設(shè)時(shí)間段內(nèi)用戶的語音交互數(shù)據(jù)的步驟之后還包括如下步驟:
所述服務(wù)器端對(duì)其從所述用戶端接收的所述語音交互數(shù)據(jù)進(jìn)行預(yù)處理,以去掉所述語音交互數(shù)據(jù)中的無意義詞匯并進(jìn)行分詞處理;
則所述服務(wù)器端將其從所述用戶端接收的所述語音交互數(shù)據(jù)輸入至所述喚醒詞模型以得到對(duì)應(yīng)的喚醒詞的步驟相應(yīng)為:
所述服務(wù)器端將其從所述用戶端接收并經(jīng)過預(yù)處理的所述語音交互數(shù)據(jù)輸入至所述喚醒詞模型以得到對(duì)應(yīng)的喚醒詞。
4.根據(jù)權(quán)利要求1或2所述的生成方法,其特征在于,
在所述服務(wù)器端向所述用戶端發(fā)送所述喚醒詞的步驟之后還包括如下步驟:
所述服務(wù)器端通過所述用戶端接收所述用戶發(fā)送的喚醒詞反饋信息,所述喚醒詞反饋信息包括喚醒詞確認(rèn)信息和喚醒詞修正信息;
所述服務(wù)器端在接收到所述喚醒詞確認(rèn)信息時(shí),保持所述喚醒詞不變;
所述服務(wù)器端在接收到所述喚醒詞修正信息時(shí),繼續(xù)通過所述用戶端接收所述用戶發(fā)送的新喚醒詞,并將其對(duì)應(yīng)的原喚醒詞替換為所述新喚醒詞。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司,未經(jīng)中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810550875.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗(yàn)設(shè)備、驗(yàn)證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動(dòng)設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





