[發(fā)明專利]機器人發(fā)聲自動調(diào)整系統(tǒng)在審

申請?zhí)枺?/td>	201710390548.5	申請日：	2017-05-27
公開（公告）號：	CN107358949A	公開（公告）日：	2017-11-17
發(fā)明（設(shè)計）人：	陳琦;許壯志;徐健華;易昊;劉彬;范傳奇;梅志	申請（專利權(quán)）人：	蕪湖星途機器人科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L17/26;G10L13/033;G06K9/00;G06K9/46;G06K9/62
代理公司：	北京潤平知識產(chǎn)權(quán)代理有限公司11283	代理人：	鄒飛艷,張苗
地址：	241000 安徽省蕪湖***	國省代碼：	安徽;34
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	機器人發(fā)聲自動調(diào)整系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及機器人控制系統(tǒng)領(lǐng)域，具體地，涉及一種機器人發(fā)聲自動調(diào)整系統(tǒng)。

背景技術(shù)

機器人(Robot)是自動執(zhí)行工作的機器裝置。它既可以接受人類指揮，又可以運行預先編排的程序，也可以根據(jù)以人工智能技術(shù)制定的原則綱領(lǐng)行動，隨著社會的發(fā)展，機器人的技術(shù)也得到了飛速地發(fā)展，因此，機器人的應用也越來越普遍了，對于機器人設(shè)計也各種各樣。

機器人中有一類稱為服務型機器人，一般用于服務行業(yè)來對客戶進行專職服務的，所以對人性化地要求較高，對于不同年紀的用戶，可以聽清的語速也是不同的，比如老年人聽力下降，和他溝通時也許適合慢一點的語速，但是現(xiàn)有技術(shù)中的機器人在和用戶進行語音交互時的發(fā)聲方式和語速是確定的，這樣就導致用戶的體驗效果差，人性化程度不夠。

因此，提供一種在使用過程中可以根據(jù)交互者的信息來判斷交互者的年紀特征，從而自動調(diào)節(jié)發(fā)聲方式和語速的機器人發(fā)聲自動調(diào)整系統(tǒng)是本發(fā)明亟需解決的問題。

發(fā)明內(nèi)容

針對上述技術(shù)問題，本發(fā)明的目的是克服現(xiàn)有技術(shù)中的機器人在和用戶進行語音交互時的發(fā)聲方式和語速是確定的，這樣就導致用戶的體驗效果差，人性化程度不夠的問題，從而提供一種在使用過程中可以根據(jù)交互者的信息來判斷交互者的年紀特征，從而自動調(diào)節(jié)發(fā)聲方式和語速的機器人發(fā)聲自動調(diào)整系統(tǒng)。

為了實現(xiàn)上述目的，本發(fā)明提供了一種機器人發(fā)聲自動調(diào)整系統(tǒng)，所述機器人發(fā)聲自動調(diào)整系統(tǒng)包括：控制器、語音采集模塊、語音識別模塊、圖像采集模塊、圖像識別模塊和機器人發(fā)聲模塊，所述語音采集模塊與所述語音識別模塊相連，所述圖像采集模塊與所述圖像識別模塊相連，所述語音識別模塊、所述圖像識別模塊和所述機器人發(fā)聲模塊分別與所述控制器相連；其中，所述語音采集模塊用于采集交互者的語音信息；所述語音識別模塊利用麥克風陣列聲學分析交互者的語音信息；所述圖像采集模塊用于采集交互者的臉部圖像信息；所述圖像識別模塊對采集的交互者的臉部圖像信息進行分析從而對交互者的年齡進行分類；所述控制器根據(jù)所述語音識別模塊和所述圖像識別模塊的分析結(jié)果調(diào)節(jié)所述機器人發(fā)聲模塊，從而調(diào)節(jié)機器人的發(fā)聲方式和語速。

優(yōu)選地，所述圖像識別模塊被配置首先對采集的交互者的臉部圖像信息進行預處理，然后對臉部圖像信息進行特征提取，再進行降維處理，最后對交互者的年齡進行分類。

優(yōu)選地，所述圖像識別模塊對臉部圖像信息進行的預處理包括：圖像灰度化、幾何歸一化和直方圖均衡化。

優(yōu)選地，特征提取采用均勻LBP對臉部圖像信息中人臉紋理的局部特征進行提取。

優(yōu)選地，所述降維處理采用PCA算法。

優(yōu)選地，在對交互者的年齡進行分類時利用K近鄰算法。

優(yōu)選地，所述圖像采集模塊包括：高清攝像頭和AD轉(zhuǎn)換器，所述高清攝像頭用于對召喚者的圖像進行采集，所述AD轉(zhuǎn)換器用于將所述高清攝像頭采集的模擬信號轉(zhuǎn)換成數(shù)字信號，并輸出至所述圖像識別模塊中。

根據(jù)上述技術(shù)方案，本發(fā)明提供的機器人發(fā)聲自動調(diào)整系統(tǒng)中所述控制器用來分析和處理系統(tǒng)中各模塊采集的數(shù)據(jù)，并且協(xié)調(diào)各模塊之間有序地工作，在使用時，所述語音采集模塊和所述圖像采集模塊分別采集交互者的語音信息和臉部圖像信息，所述圖像識別模塊對采集的交互者的臉部圖像信息進行分析從而對交互者的年齡進行分類，所述語音識別模塊利用麥克風陣列聲學分析交互者的語音信息，從而對交互者的年齡進行分類，所述控制器綜合兩者的分類結(jié)果進行交互者的年齡最后的估算，然后根據(jù)估算的結(jié)果控制所述發(fā)聲模塊發(fā)出適合的聲音，這種適合指的是發(fā)聲方式和語速合適該年齡段交互者，發(fā)聲方式包括是男聲還是女聲，發(fā)聲時的情感等，從而給交互者更加良好地交互體驗。本發(fā)明的機器人發(fā)聲自動調(diào)整系統(tǒng)克服現(xiàn)有技術(shù)中的機器人在和用戶進行語音交互時的發(fā)聲方式和語速是確定的，這樣就導致用戶的體驗效果差，人性化程度不夠的問題。

本發(fā)明的其他特征和優(yōu)點將在隨后的具體實施方式部分予以詳細說明。

附圖說明

附圖是用來提供對本發(fā)明的進一步理解，并且構(gòu)成說明書的一部分，與下面的具體實施方式一起用于解釋本發(fā)明，但并不構(gòu)成對本發(fā)明的限制。在附圖中：

圖1是本發(fā)明的一種優(yōu)選的實施方式中提供的機器人發(fā)聲自動調(diào)整系統(tǒng)的結(jié)構(gòu)框圖。

具體實施方式

以下結(jié)合附圖對本發(fā)明的具體實施方式進行詳細說明。應當理解的是，此處所描述的具體實施方式僅用于說明和解釋本發(fā)明，并不用于限制本發(fā)明。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蕪湖星途機器人科技有限公司，未經(jīng)蕪湖星途機器人科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710390548.5/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：基于注意力模型的語言輸入關(guān)聯(lián)性檢測方法
下一篇：服務機器人語音交互系統(tǒng)

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓練語音識別系統(tǒng)，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】