[發(fā)明專利]一種人臉圖像生成方法及電子設(shè)備在審

申請?zhí)枺?/td>	201911033642.0	申請日：	2019-10-28
公開（公告）號：	CN110706713A	公開（公告）日：	2020-01-17
發(fā)明（設(shè)計(jì)）人：	黃俊仁	申請（專利權(quán)）人：	維沃移動(dòng)通信有限公司
主分類號：	G10L17/02	分類號：	G10L17/02;G10L17/04;G10L25/24;G06K9/00;G06K9/62
代理公司：	11319 北京潤澤恒知識產(chǎn)權(quán)代理有限公司	代理人：	莎日娜
地址：	523860 廣東省***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	電子設(shè)備目標(biāo)音頻人臉圖像聲紋特征通話方通話語音通話功能獲取目標(biāo) 目標(biāo)模型輸出目標(biāo) 語音信息預(yù)先生成直觀
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種人臉圖像生成方法及電子設(shè)備，該方法包括：獲取目標(biāo)音頻；提取所述目標(biāo)音頻的聲紋特征數(shù)據(jù)；將所述目標(biāo)音頻的聲紋特征數(shù)據(jù)輸入至預(yù)先生成的目標(biāo)模型，輸出目標(biāo)人臉圖像。實(shí)施上述方法，可以基于通話方的語音信息，通過更直觀地方式，顯示通話方的形象，能夠滿足通話一方對通話另一方聲音的想象，豐富電子設(shè)備的語音通話功能。

技術(shù)領(lǐng)域

本發(fā)明實(shí)施例涉及人工智能技術(shù)領(lǐng)域，尤其涉及一種人臉圖像生成方法及電子設(shè)備。

背景技術(shù)

隨著電子技術(shù)的發(fā)展，諸如智能手機(jī)、平板電腦等電子設(shè)備能夠支持的功能越來越多，例如，電子設(shè)備可以支持用戶與其他用戶之間進(jìn)行語音通話。現(xiàn)有技術(shù)中，電子設(shè)備用戶之間只能進(jìn)行簡單的語音通話，語音通話功能比較單一。

發(fā)明內(nèi)容

本發(fā)明實(shí)施例提供一種人臉圖像生成方法及電子設(shè)備，以解決現(xiàn)有技術(shù)中存在的語音通話功能單一的技術(shù)問題。

為解決上述技術(shù)問題，本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的：

第一方面，本發(fā)明實(shí)施例提供了一種人臉圖像生成方法，所述方法包括：

獲取目標(biāo)音頻；

提取所述目標(biāo)音頻的聲紋特征數(shù)據(jù)；

將所述目標(biāo)音頻的聲紋特征數(shù)據(jù)輸入至預(yù)先生成的目標(biāo)模型，輸出目標(biāo)人臉圖像。

第二方面，本發(fā)明實(shí)施例還提供了一種電子設(shè)備，所述電子設(shè)備包括：

第一獲取單元，用于獲取目標(biāo)音頻；

第一提取單元，用于提取所述目標(biāo)音頻的聲紋特征數(shù)據(jù)；

第一處理單元，用于將所述目標(biāo)音頻的聲紋特征數(shù)據(jù)輸入至預(yù)先生成的目標(biāo)模型，輸出目標(biāo)人臉圖像。

第三方面，本發(fā)明實(shí)施例還提供了一種電子設(shè)備，包括處理器、存儲器及存儲在所述存儲器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被所述處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一項(xiàng)所述的人臉圖像生成方法的步驟。

第四方面，本發(fā)明實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲介質(zhì)，所述計(jì)算機(jī)可讀存儲介質(zhì)上存儲計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任一項(xiàng)所述的人臉圖像生成方法的步驟。

本發(fā)明實(shí)施例中，可以獲取目標(biāo)音頻，提取目標(biāo)音頻的聲紋特征數(shù)據(jù)，將目標(biāo)音頻的聲紋特征數(shù)據(jù)輸入至預(yù)先生成的目標(biāo)模型，輸出目標(biāo)人臉圖像。本發(fā)明實(shí)施例中，可以基于通話方的語音信息，通過更直觀地方式，顯示通話方的形象，能夠滿足通話一方對通話另一方聲音的想象，豐富電子設(shè)備的語音通話功能。

附圖說明

圖1是本發(fā)明實(shí)施例提供的人臉圖像生成方法的流程圖；

圖2是本發(fā)明實(shí)施例提供目標(biāo)模型訓(xùn)練方法的流程圖；

圖3是本發(fā)明實(shí)施例提供的步驟203的一種實(shí)施方式的流程圖；

圖4是本發(fā)明實(shí)施例提供的目標(biāo)解碼模型訓(xùn)練過程的示意圖；

圖5是本發(fā)明實(shí)施例提供的目標(biāo)編碼模型訓(xùn)練過程的示意圖；

圖6是本發(fā)明實(shí)施例提供的電子設(shè)備的結(jié)構(gòu)示意圖；

圖7是實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例的一種電子設(shè)備的硬件結(jié)構(gòu)示意圖之一；

圖8是實(shí)現(xiàn)本發(fā)明各個(gè)實(shí)施例的一種電子設(shè)備的硬件結(jié)構(gòu)示意圖之二。

具體實(shí)施方式

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于維沃移動(dòng)通信有限公司，未經(jīng)維沃移動(dòng)通信有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201911033642.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：家居環(huán)境下的錄音重放檢測方法
下一篇：說話者模型制作系統(tǒng)

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L17-00 講話者辨認(rèn)或驗(yàn)證

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】