[發(fā)明專利]機器人發(fā)聲自動調(diào)整系統(tǒng)在審
| 申請?zhí)枺?/td> | 201710390548.5 | 申請日: | 2017-05-27 |
| 公開(公告)號: | CN107358949A | 公開(公告)日: | 2017-11-17 |
| 發(fā)明(設(shè)計)人: | 陳琦;許壯志;徐健華;易昊;劉彬;范傳奇;梅志 | 申請(專利權(quán))人: | 蕪湖星途機器人科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L17/26;G10L13/033;G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 北京潤平知識產(chǎn)權(quán)代理有限公司11283 | 代理人: | 鄒飛艷,張苗 |
| 地址: | 241000 安徽省蕪湖*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 機器人 發(fā)聲 自動 調(diào)整 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及機器人控制系統(tǒng)領(lǐng)域,具體地,涉及一種機器人發(fā)聲自動調(diào)整系統(tǒng)。
背景技術(shù)
機器人(Robot)是自動執(zhí)行工作的機器裝置。它既可以接受人類指揮,又可以運行預先編排的程序,也可以根據(jù)以人工智能技術(shù)制定的原則綱領(lǐng)行動,隨著社會的發(fā)展,機器人的技術(shù)也得到了飛速地發(fā)展,因此,機器人的應用也越來越普遍了,對于機器人設(shè)計也各種各樣。
機器人中有一類稱為服務型機器人,一般用于服務行業(yè)來對客戶進行專職服務的,所以對人性化地要求較高,對于不同年紀的用戶,可以聽清的語速也是不同的,比如老年人聽力下降,和他溝通時也許適合慢一點的語速,但是現(xiàn)有技術(shù)中的機器人在和用戶進行語音交互時的發(fā)聲方式和語速是確定的,這樣就導致用戶的體驗效果差,人性化程度不夠。
因此,提供一種在使用過程中可以根據(jù)交互者的信息來判斷交互者的年紀特征,從而自動調(diào)節(jié)發(fā)聲方式和語速的機器人發(fā)聲自動調(diào)整系統(tǒng)是本發(fā)明亟需解決的問題。
發(fā)明內(nèi)容
針對上述技術(shù)問題,本發(fā)明的目的是克服現(xiàn)有技術(shù)中的機器人在和用戶進行語音交互時的發(fā)聲方式和語速是確定的,這樣就導致用戶的體驗效果差,人性化程度不夠的問題,從而提供一種在使用過程中可以根據(jù)交互者的信息來判斷交互者的年紀特征,從而自動調(diào)節(jié)發(fā)聲方式和語速的機器人發(fā)聲自動調(diào)整系統(tǒng)。
為了實現(xiàn)上述目的,本發(fā)明提供了一種機器人發(fā)聲自動調(diào)整系統(tǒng),所述機器人發(fā)聲自動調(diào)整系統(tǒng)包括:控制器、語音采集模塊、語音識別模塊、圖像采集模塊、圖像識別模塊和機器人發(fā)聲模塊,所述語音采集模塊與所述語音識別模塊相連,所述圖像采集模塊與所述圖像識別模塊相連,所述語音識別模塊、所述圖像識別模塊和所述機器人發(fā)聲模塊分別與所述控制器相連;其中,所述語音采集模塊用于采集交互者的語音信息;所述語音識別模塊利用麥克風陣列聲學分析交互者的語音信息;所述圖像采集模塊用于采集交互者的臉部圖像信息;所述圖像識別模塊對采集的交互者的臉部圖像信息進行分析從而對交互者的年齡進行分類;所述控制器根據(jù)所述語音識別模塊和所述圖像識別模塊的分析結(jié)果調(diào)節(jié)所述機器人發(fā)聲模塊,從而調(diào)節(jié)機器人的發(fā)聲方式和語速。
優(yōu)選地,所述圖像識別模塊被配置首先對采集的交互者的臉部圖像信息進行預處理,然后對臉部圖像信息進行特征提取,再進行降維處理,最后對交互者的年齡進行分類。
優(yōu)選地,所述圖像識別模塊對臉部圖像信息進行的預處理包括:圖像灰度化、幾何歸一化和直方圖均衡化。
優(yōu)選地,特征提取采用均勻LBP對臉部圖像信息中人臉紋理的局部特征進行提取。
優(yōu)選地,所述降維處理采用PCA算法。
優(yōu)選地,在對交互者的年齡進行分類時利用K近鄰算法。
優(yōu)選地,所述圖像采集模塊包括:高清攝像頭和AD轉(zhuǎn)換器,所述高清攝像頭用于對召喚者的圖像進行采集,所述AD轉(zhuǎn)換器用于將所述高清攝像頭采集的模擬信號轉(zhuǎn)換成數(shù)字信號,并輸出至所述圖像識別模塊中。
根據(jù)上述技術(shù)方案,本發(fā)明提供的機器人發(fā)聲自動調(diào)整系統(tǒng)中所述控制器用來分析和處理系統(tǒng)中各模塊采集的數(shù)據(jù),并且協(xié)調(diào)各模塊之間有序地工作,在使用時,所述語音采集模塊和所述圖像采集模塊分別采集交互者的語音信息和臉部圖像信息,所述圖像識別模塊對采集的交互者的臉部圖像信息進行分析從而對交互者的年齡進行分類,所述語音識別模塊利用麥克風陣列聲學分析交互者的語音信息,從而對交互者的年齡進行分類,所述控制器綜合兩者的分類結(jié)果進行交互者的年齡最后的估算,然后根據(jù)估算的結(jié)果控制所述發(fā)聲模塊發(fā)出適合的聲音,這種適合指的是發(fā)聲方式和語速合適該年齡段交互者,發(fā)聲方式包括是男聲還是女聲,發(fā)聲時的情感等,從而給交互者更加良好地交互體驗。本發(fā)明的機器人發(fā)聲自動調(diào)整系統(tǒng)克服現(xiàn)有技術(shù)中的機器人在和用戶進行語音交互時的發(fā)聲方式和語速是確定的,這樣就導致用戶的體驗效果差,人性化程度不夠的問題。
本發(fā)明的其他特征和優(yōu)點將在隨后的具體實施方式部分予以詳細說明。
附圖說明
附圖是用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與下面的具體實施方式一起用于解釋本發(fā)明,但并不構(gòu)成對本發(fā)明的限制。在附圖中:
圖1是本發(fā)明的一種優(yōu)選的實施方式中提供的機器人發(fā)聲自動調(diào)整系統(tǒng)的結(jié)構(gòu)框圖。
具體實施方式
以下結(jié)合附圖對本發(fā)明的具體實施方式進行詳細說明。應當理解的是,此處所描述的具體實施方式僅用于說明和解釋本發(fā)明,并不用于限制本發(fā)明。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蕪湖星途機器人科技有限公司,未經(jīng)蕪湖星途機器人科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710390548.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 色相調(diào)整系統(tǒng)及其調(diào)整方法
- 調(diào)整設(shè)備和調(diào)整方法
- 踏板調(diào)整結(jié)構(gòu)及調(diào)整步態(tài)的調(diào)整方法
- 立體深度調(diào)整和焦點調(diào)整
- 調(diào)整裝置及其調(diào)整方法
- 噴嘴調(diào)整工具及調(diào)整方法
- 調(diào)整系統(tǒng)及調(diào)整方法
- 調(diào)整裝置以及調(diào)整方法
- 環(huán)境調(diào)整系統(tǒng)、環(huán)境調(diào)整方法及環(huán)境調(diào)整程序
- 功率調(diào)整器(調(diào)整)





