[發(fā)明專利]語(yǔ)音控制指令的生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110591864.5 | 申請(qǐng)日: | 2021-05-28 |
| 公開(kāi)(公告)號(hào): | CN113434108B | 公開(kāi)(公告)日: | 2022-10-25 |
| 發(fā)明(設(shè)計(jì))人: | 李皈穎;汪至圓;唐珂;楊鵬 | 申請(qǐng)(專利權(quán))人: | 南方科技大學(xué) |
| 主分類號(hào): | G06F3/16 | 分類號(hào): | G06F3/16;G06F40/30;G06F40/284;G06N3/04 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 潘登 |
| 地址: | 518055 廣東省*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 控制 指令 生成 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種語(yǔ)音控制指令的生成方法,其特征在于,包括:
構(gòu)建口語(yǔ)理解模型,所述口語(yǔ)理解模型依次包括詞向量部分和語(yǔ)義理解部分;
分別對(duì)所述詞向量部分和所述語(yǔ)義理解部分進(jìn)行壓縮;
使用壓縮后的所述口語(yǔ)理解模型對(duì)用戶的語(yǔ)音語(yǔ)言信息進(jìn)行解析以生成語(yǔ)音控制指令;
所述對(duì)所述詞向量部分進(jìn)行壓縮,包括:
采用編碼知識(shí)蒸餾方法對(duì)詞向量的維度進(jìn)行壓縮;
采用向量組合編碼壓縮方法對(duì)詞向量的數(shù)量進(jìn)行壓縮。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音控制指令的生成方法,其特征在于,所述采用編碼知識(shí)蒸餾方法對(duì)詞向量的維度進(jìn)行壓縮,包括:
對(duì)所述口語(yǔ)理解模型進(jìn)行訓(xùn)練,得到所述詞向量部分的基準(zhǔn)嵌入表達(dá)矩陣;
在所述基準(zhǔn)嵌入表達(dá)矩陣與所述語(yǔ)義理解部分之間插入一個(gè)編碼層;
固定所述基準(zhǔn)嵌入表達(dá)矩陣,并重新對(duì)所述口語(yǔ)理解模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的所述編碼層;
將所述基準(zhǔn)嵌入表達(dá)矩陣通過(guò)訓(xùn)練后的所述編碼層以得到壓縮后的嵌入表達(dá)矩陣。
3.根據(jù)權(quán)利要求1所述的語(yǔ)音控制指令的生成方法,其特征在于,所述采用向量組合編碼壓縮方法對(duì)詞向量的數(shù)量進(jìn)行壓縮,包括:
提取所述詞向量部分的嵌入表達(dá)矩陣;
確定所述嵌入表達(dá)矩陣對(duì)應(yīng)的密碼本,所述密碼本用于存儲(chǔ)基準(zhǔn)詞義向量;
針對(duì)每個(gè)詞語(yǔ),使用一個(gè)編碼矩陣來(lái)存儲(chǔ)所述詞語(yǔ)對(duì)應(yīng)的基準(zhǔn)詞義向量;
將所述詞語(yǔ)對(duì)應(yīng)的各個(gè)基準(zhǔn)詞義向量相加以得到所述詞語(yǔ)的最終詞義向量。
4.根據(jù)權(quán)利要求1所述的語(yǔ)音控制指令的生成方法,其特征在于,所述對(duì)所述語(yǔ)義理解部分進(jìn)行壓縮,包括:
采用知識(shí)蒸餾方法對(duì)所述語(yǔ)義理解部分進(jìn)行壓縮,所述知識(shí)蒸餾方法包括單詞級(jí)知識(shí)蒸餾和/或序列級(jí)知識(shí)蒸餾。
5.根據(jù)權(quán)利要求1所述的語(yǔ)音控制指令的生成方法,其特征在于,在所述使用壓縮后的所述口語(yǔ)理解模型對(duì)用戶的語(yǔ)音語(yǔ)言信息進(jìn)行解析以生成語(yǔ)音控制指令之前,還包括:
基于邊云協(xié)同對(duì)所述口語(yǔ)理解模型進(jìn)行壓縮。
6.根據(jù)權(quán)利要求5所述的語(yǔ)音控制指令的生成方法,其特征在于,所述基于邊云協(xié)同對(duì)所述口語(yǔ)理解模型進(jìn)行壓縮,包括:
通過(guò)云端GPU服務(wù)器對(duì)所述口語(yǔ)理解模型進(jìn)行壓縮;
將壓縮后的所述口語(yǔ)理解模型發(fā)送到邊緣端的測(cè)試設(shè)備上進(jìn)行測(cè)試,并采集測(cè)試數(shù)據(jù);
根據(jù)所述測(cè)試數(shù)據(jù)指導(dǎo)所述云端GPU服務(wù)器對(duì)所述口語(yǔ)理解模型進(jìn)行再一次壓縮;
迭代進(jìn)行所述測(cè)試設(shè)備上的測(cè)試過(guò)程和所述云端GPU服務(wù)器的壓縮過(guò)程,直至經(jīng)過(guò)所述云端GPU服務(wù)器壓縮后的所述口語(yǔ)理解模型無(wú)法達(dá)到預(yù)設(shè)精度的要求。
7.一種語(yǔ)音控制指令的生成裝置,其特征在于,包括:
模型構(gòu)建模塊,用于構(gòu)建口語(yǔ)理解模型,所述口語(yǔ)理解模型依次包括詞向量部分和語(yǔ)義理解部分;
模型壓縮模塊,用于分別對(duì)所述詞向量部分和所述語(yǔ)義理解部分進(jìn)行壓縮;
指令生成模塊,用于使用壓縮后的所述口語(yǔ)理解模型對(duì)用戶的語(yǔ)音語(yǔ)言信息進(jìn)行解析以生成語(yǔ)音控制指令;
所述模型壓縮模塊包括:
維度壓縮單元,用于采用編碼知識(shí)蒸餾方法對(duì)詞向量的維度進(jìn)行壓縮;
數(shù)量壓縮單元,用于采用向量組合編碼壓縮方法對(duì)詞向量的數(shù)量進(jìn)行壓縮。
8.一種計(jì)算機(jī)設(shè)備,其特征在于,包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序;
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如權(quán)利要求1-6中任一所述的語(yǔ)音控制指令的生成方法。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-6中任一所述的語(yǔ)音控制指令的生成方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南方科技大學(xué),未經(jīng)南方科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110591864.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來(lái)自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)





