[發(fā)明專利]語音交互方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201410670573.5 | 申請(qǐng)日: | 2014-11-20 |
| 公開(公告)號(hào): | CN104391673A | 公開(公告)日: | 2015-03-04 |
| 發(fā)明(設(shè)計(jì))人: | 李秀林 | 申請(qǐng)(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號(hào): | G06F3/16 | 分類號(hào): | G06F3/16;G10L15/14;G10L15/08 |
| 代理公司: | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 交互 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種語音交互方法和裝置。
背景技術(shù)
在人類的發(fā)展歷史上,語言對(duì)于文明的發(fā)展是至關(guān)重要的。語音,數(shù)千年來,一直作為人類進(jìn)行信息交流的重要載體,也在不斷變化和演進(jìn)。在不同地區(qū),語言和語音,也會(huì)因環(huán)境和歷史的不同,而有明顯差異。因此,語言不僅包括普通話,還包括方言和口音。
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,人機(jī)交互也變得越來越重要,語音交互是一種人機(jī)交互形式。方言和口音的問題,一直以來,都是語音識(shí)別和合成領(lǐng)域的一個(gè)難點(diǎn),很多研究者,是通過收集更多的數(shù)據(jù),建立新的語音模型,或者優(yōu)化原有的模型,以改善識(shí)別和合成的效果。用戶在使用人機(jī)對(duì)話系統(tǒng)時(shí),只能通過默認(rèn)的方言/口音設(shè)置,或者手工修改方言/口音設(shè)置,來實(shí)現(xiàn)期望的結(jié)果,造成對(duì)話效果不夠理想,用戶體驗(yàn)較差。
發(fā)明內(nèi)容
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的一個(gè)目的在于提出一種語音交互方法,該方法可以提高語音交互效果,提升用戶體驗(yàn)。
本發(fā)明的另一個(gè)目的在于提出一種語音交互裝置。
為達(dá)到上述目的,本發(fā)明第一方面實(shí)施例提出的語音交互方法,包括:接收輸入語音,并對(duì)所述輸入語音進(jìn)行特征提取,得到所述輸入語音的特征信息;根據(jù)所述特征信息進(jìn)行語音特點(diǎn)識(shí)別以及語音識(shí)別,得到語音特點(diǎn)和語音識(shí)別結(jié)果,其中,所述語音特點(diǎn)包括:方言,口音或者普通話;根據(jù)所述語音識(shí)別結(jié)果和所述語音特點(diǎn),獲取與所述輸入的語音對(duì)應(yīng)的答案;根據(jù)所述語音特點(diǎn)和所述答案,生成輸出語音,所述輸出語音是與所述答案對(duì)應(yīng)的且具有所述語音特點(diǎn)的語音。
本發(fā)明第一方面實(shí)施例提出的語音交互方法,通過對(duì)輸入語音進(jìn)行語音特點(diǎn)識(shí)別,可以選取與語音特點(diǎn)匹配的語音識(shí)別模型對(duì)輸入語音進(jìn)行語音識(shí)別,從而可以提高語音交互效果,提升用戶體驗(yàn)。
為達(dá)到上述目的,本發(fā)明第二方面實(shí)施例提出的語音交互裝置,包括:輸入模塊,用于接收輸入語音,并對(duì)所述輸入語音進(jìn)行特征提取,得到所述輸入語音的特征信息;識(shí)別模塊,用于根據(jù)所述特征信息進(jìn)行語音特點(diǎn)識(shí)別以及語音識(shí)別,得到語音特點(diǎn)和語音識(shí)別結(jié)果,其中,所述語音特點(diǎn)包括:方言,口音或者普通話;獲取模塊,用于根據(jù)所述語音識(shí)別結(jié)果和所述語音特點(diǎn),獲取與所述輸入的語音對(duì)應(yīng)的答案;輸出模塊,用于根據(jù)所述語音特點(diǎn)和所述答案,生成輸出語音,所述輸出語音是與所述答案對(duì)應(yīng)的且具有所述語音特點(diǎn)的語音。
本發(fā)明第二方面實(shí)施例提出的語音交互裝置,通過對(duì)輸入語音進(jìn)行語音特點(diǎn)識(shí)別,可以選取與語音特點(diǎn)匹配的語音識(shí)別模型對(duì)輸入語音進(jìn)行語音識(shí)別,從而可以提高語音交互效果,提升用戶體驗(yàn)。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
附圖說明
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1是本發(fā)明一實(shí)施例提出的語音交互方法的流程示意圖;
圖2是本發(fā)明實(shí)施例中獲取語音特點(diǎn)的流程示意圖;
圖3是本發(fā)明實(shí)施例中獲取語音特點(diǎn)和語音識(shí)別結(jié)果的流程示意圖;
圖4是本發(fā)明實(shí)施例中生成輸出語音的流程示意圖;
圖5是本發(fā)明另一實(shí)施例提出的語音交互方法的流程示意圖;
圖6是本發(fā)明另一實(shí)施例提出的語音交互裝置的結(jié)構(gòu)示意圖;
圖7是本發(fā)明另一實(shí)施例提出的語音交互裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。相反,本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。
圖1是本發(fā)明一實(shí)施例提出的語音交互方法的流程示意圖,該方法包括:
S11:接收輸入語音,并對(duì)所述輸入語音進(jìn)行特征提取,得到所述輸入語音的特征信息。
輸入語音是用戶輸入到語音交互系統(tǒng)中的語音,輸入語音具體可以是問題,例如,輸入語音是“今天天氣怎么樣”的語音。
語音交互系統(tǒng)可以通過麥克風(fēng)等設(shè)備接收輸入語音,接收到輸入語音后,可以對(duì)輸入語音進(jìn)行降噪等預(yù)處理,預(yù)處理后的輸入語音再進(jìn)行特征提取,例如提取譜特征,基頻特征,能量特征或者過零率等。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410670573.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





