[發(fā)明專利]語音交互方法、系統(tǒng)、存儲介質(zhì)以及電子設(shè)備在審
| 申請?zhí)枺?/td> | 202010546399.9 | 申請日: | 2020-06-15 |
| 公開(公告)號: | CN113808575A | 公開(公告)日: | 2021-12-17 |
| 發(fā)明(設(shè)計(jì))人: | 楊昌品;宋德超;黃姿榮;賈巨濤;韓林嶧 | 申請(專利權(quán))人: | 珠海格力電器股份有限公司;珠海聯(lián)云科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/07;G10L15/22;G10L15/26;G10L17/02;G10L17/14 |
| 代理公司: | 北京聿宏知識產(chǎn)權(quán)代理有限公司 11372 | 代理人: | 吳大建;金淼 |
| 地址: | 519000*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 交互 方法 系統(tǒng) 存儲 介質(zhì) 以及 電子設(shè)備 | ||
本發(fā)明公開了一種語音交互方法、系統(tǒng)、存儲介質(zhì)以及電子設(shè)備,涉及語音交互技術(shù)領(lǐng)域,該方法包括:獲取語音信息;確定發(fā)出所述語音信息的發(fā)聲者的特征信息;根據(jù)所述特征信息,確定發(fā)出所述語音信息的發(fā)聲者隸屬的群體類別;獲取與所述群體類別相匹配的語料庫;從所述語料庫中獲取與所述語音信息相匹配的語義意圖;控制智能設(shè)備執(zhí)行響應(yīng)所述語義意圖的動(dòng)作。本發(fā)明的有益效果是:利用對應(yīng)的語料庫來精確識別該語音信息要表達(dá)的語義意圖,從而提高語義意圖識別的準(zhǔn)確度。
技術(shù)領(lǐng)域
本發(fā)明屬于語音交互技術(shù)領(lǐng)域,尤其涉及一種語音交互方法、系統(tǒng)、存儲介質(zhì)以及電子設(shè)備。
背景技術(shù)
在語音交互過程中,用戶對話部分起著承上啟下的左右,用戶通過客戶端說的話經(jīng)過ASR(語音識別)轉(zhuǎn)為文本后進(jìn)入對話系統(tǒng),在對話系統(tǒng)中通過語義理解和對話決策后,調(diào)用指定的服務(wù)內(nèi)容,輸出相應(yīng)的文本內(nèi)容,再經(jīng)過TTS(從文本到語音)轉(zhuǎn)換成語音后返回給客戶端上的用戶。目前,通常的語義理解模型都是基于通用話術(shù)訓(xùn)練模型來實(shí)現(xiàn)的,但是,由于不同用戶所處的地域、年齡以及性格不同,導(dǎo)致用戶的表達(dá)方式風(fēng)格迥異,表達(dá)語義意圖的話術(shù)的句式結(jié)構(gòu)也各有不同,從而導(dǎo)致大多數(shù)的語義理解處理度都不夠高,無法準(zhǔn)確理解用戶的意圖。
發(fā)明內(nèi)容
本發(fā)明正是基于現(xiàn)有的語義理解技術(shù)無法準(zhǔn)確理解不同用戶的意圖的技術(shù)問題,提出了一種語音交互方法、系統(tǒng)、存儲介質(zhì)以及電子設(shè)備。
第一方面,本發(fā)明實(shí)施例提供了一種語音交互方法,包括:
獲取語音信息;
確定發(fā)出所述語音信息的發(fā)聲者的特征信息;其中,所述特征信息能夠用于表征發(fā)聲者所屬的群體類別;
根據(jù)所述特征信息,確定發(fā)出所述語音信息的發(fā)聲者隸屬的群體類別;
獲取與所述群體類別相匹配的語料庫;
從所述語料庫中獲取與所述語音信息相匹配的語義意圖;
控制智能設(shè)備執(zhí)行響應(yīng)所述語義意圖的動(dòng)作。
可選地,預(yù)先通過以下步驟建立所述語料庫:
獲取隸屬同一群體類別的發(fā)聲者的歷史語音對話數(shù)據(jù),其中,所述歷史語音對話數(shù)據(jù)包括歷史語音信息以及該歷史語音信息所表達(dá)的語義意圖;
通過對所述歷史語音對話數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從所述歷史語音對話數(shù)據(jù)中確定出隸屬該群體類別的發(fā)聲者表達(dá)同一語義意圖時(shí)所使用的歷史語音信息的共同語言特征,并將所述共同語言特征與與之對應(yīng)的語義意圖建立關(guān)聯(lián)關(guān)系,從而構(gòu)建所述語料庫。
可選地,所述共同語言特征包括多頻詞、關(guān)鍵詞、語言句式以及語氣詞中的至少一種。
可選地,通過對所述歷史語音對話數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,從所述歷史語音對話數(shù)據(jù)中確定出隸屬該群體類別的發(fā)聲者表達(dá)同一語義意圖時(shí)所使用的歷史語音信息的共同語言特征,并將所述共同語言特征與與之對應(yīng)的語義意圖建立關(guān)聯(lián)關(guān)系,從而構(gòu)建所述語料庫,包括:
當(dāng)所述共同語言特征包括多頻詞時(shí),確定歷史語音信息中的多頻詞以及該多頻詞所表達(dá)的語義意圖,并將所述多頻詞與與之對應(yīng)的語義意圖建立關(guān)聯(lián)關(guān)系,從而構(gòu)建所述語料庫;其中,所述多頻詞為出現(xiàn)次數(shù)超過預(yù)設(shè)閾值的詞語;
當(dāng)所述共同語言特征包括關(guān)鍵詞時(shí),從所述歷史語音對話數(shù)據(jù)中選取出表達(dá)同一語義意圖的歷史語音信息;
從選取出的歷史語音信息中確定出能夠表達(dá)該語義意圖的關(guān)鍵詞,并將所述關(guān)鍵詞與與之對應(yīng)的語義意圖建立關(guān)聯(lián)關(guān)系,從而構(gòu)建所述語料庫;
當(dāng)所述共同語言特征包括語言句式時(shí),統(tǒng)計(jì)所述歷史語音對話數(shù)據(jù)中用于表達(dá)同一語義意圖的各個(gè)歷史語音信息對應(yīng)的語言句式的次數(shù),并將次數(shù)最多的語言句式與與之對應(yīng)的語義意圖進(jìn)行關(guān)聯(lián),從而構(gòu)建所述語料庫;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于珠海格力電器股份有限公司;珠海聯(lián)云科技有限公司,未經(jīng)珠海格力電器股份有限公司;珠海聯(lián)云科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010546399.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:聲學(xué)輸出裝置及其連接組件
- 下一篇:通信方法和通信裝置





