[發(fā)明專利]語音播報(bào)方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)有效
| 申請?zhí)枺?/td> | 201910002527.0 | 申請日: | 2019-01-02 |
| 公開(公告)號(hào): | CN109686362B | 公開(公告)日: | 2021-04-02 |
| 發(fā)明(設(shè)計(jì))人: | 趙濤濤 | 申請(專利權(quán))人: | 百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司 |
| 主分類號(hào): | G10L15/00 | 分類號(hào): | G10L15/00;G10L15/22;G10L15/18;G10L25/54 |
| 代理公司: | 北京市鑄成律師事務(wù)所 11313 | 代理人: | 王珺;徐瑞紅 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 播報(bào) 方法 裝置 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
本發(fā)明實(shí)施例提供了一種語音播報(bào)方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中所述方法包括:對(duì)輸入語音進(jìn)行口音識(shí)別,得到所述輸入語音的口音級(jí)別,其中,所述口音級(jí)別表示一種口音相對(duì)于目標(biāo)語言的口音的相似程度;利用所述輸入語音的口音級(jí)別確定播報(bào)方式;利用所述播報(bào)語音的播報(bào)方式輸出播報(bào)語音。本發(fā)明的一個(gè)實(shí)施例能夠使智能音箱的語音交互更加個(gè)性化,從而提升用戶的體驗(yàn);本發(fā)明的另一個(gè)實(shí)施例利用接收到所述輸入語音的裝置的所在位置確定地區(qū)信息;利用所述地區(qū)信息對(duì)所述輸入語音的口音級(jí)別進(jìn)行校準(zhǔn),從而使確定口音級(jí)別更為準(zhǔn)確。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種語音播報(bào)方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,當(dāng)今人們的生活已經(jīng)逐漸走入智能時(shí)代。人工智能技術(shù)為人們生活的諸多方面都提供了方便快捷的服務(wù)。其中,智能語音交互是基于語音輸入的智能交互模式。用戶向智能設(shè)備說話就可以得到反饋結(jié)果。在日常生活中,當(dāng)用戶使用智能音箱的時(shí)候,播報(bào)的聲音大多以普通話為主,一般可選的播報(bào)模式為童聲/成人模式,或者男聲/女聲模式。然而現(xiàn)有技術(shù)中的上述智能音箱容易使用戶產(chǎn)生過于正式的感覺,從而導(dǎo)致用戶和智能音箱之間存在一種距離感。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種語音播報(bào)方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),以解決現(xiàn)有技術(shù)中的一個(gè)或多個(gè)技術(shù)問題。
第一方面,本發(fā)明實(shí)施例提供了一種語音播報(bào)方法,包括:
對(duì)輸入語音進(jìn)行口音識(shí)別,得到所述輸入語音的口音級(jí)別,其中,所述口音級(jí)別表示一種口音相對(duì)于目標(biāo)語言的口音的相似程度;
利用所述輸入語音的口音級(jí)別確定播報(bào)方式;
利用所述播報(bào)語音的播報(bào)方式輸出播報(bào)語音。
在一種實(shí)施方式中,所述對(duì)輸入語音進(jìn)行口音識(shí)別,得到所述輸入語音的口音級(jí)別,包括:
對(duì)所述輸入語音進(jìn)行特征提取,得到所述輸入語音的特征信息;
將所述特征信息輸入到口音分級(jí)模型中,得到所述輸入語音的口音級(jí)別。
在一種實(shí)施方式中,所述利用所述輸入語音的口音級(jí)別確定播報(bào)方式,包括以下方式的至少一種:
如果所述輸入語音的口音級(jí)別為第一級(jí)別,則將所述播報(bào)方式確定為以目標(biāo)語言的口音進(jìn)行播報(bào);
如果所述輸入語音的口音級(jí)別為第二級(jí)別,則將所述播報(bào)方式確定為以第一設(shè)定區(qū)域語言的口音進(jìn)行播報(bào);
如果所述輸入語音的口音級(jí)別為第三級(jí)別,則將所述播報(bào)方式確定為以第二設(shè)定區(qū)域語言的口音進(jìn)行播報(bào);
其中,第一設(shè)定區(qū)域語言與所述目標(biāo)語言的口音相似度高于第二設(shè)定區(qū)域語言與所述目標(biāo)語言的口音相似度。
在一種實(shí)施方式中,所述利用所述播報(bào)語音的播報(bào)方式輸出播報(bào)語音,包括:
對(duì)所述輸入語音進(jìn)行語義識(shí)別,得到需求信息;
利用需求信息查找需要播報(bào)的內(nèi)容;
利用所述播報(bào)語音的播報(bào)方式,輸出與所述需要播報(bào)的內(nèi)容對(duì)應(yīng)的播報(bào)語音。
在一種實(shí)施方式中,還包括:
利用接收到所述輸入語音的裝置的所在位置確定地區(qū)信息;
利用所述地區(qū)信息對(duì)所述輸入語音的口音級(jí)別進(jìn)行校準(zhǔn)。
第二方面,本發(fā)明實(shí)施例提供了一種語音播報(bào)裝置,包括:
識(shí)別模塊,用于對(duì)輸入語音進(jìn)行口音識(shí)別,得到所述輸入語音的口音級(jí)別,其中,所述口音級(jí)別表示一種口音相對(duì)于目標(biāo)語言的口音的相似程度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司,未經(jīng)百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910002527.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





