[發(fā)明專利]語音處理系統(tǒng)、裝置及方法有效

申請(qǐng)?zhí)枺?/td>	201310507989.0	申請(qǐng)日：	2013-10-25
公開（公告）號(hào)：	CN103594086A	公開（公告）日：	2014-02-19
發(fā)明（設(shè)計(jì)）人：	林海興;董信宗	申請(qǐng)（專利權(quán)）人：	鴻富錦精密工業(yè)（深圳）有限公司;鴻海精密工業(yè)股份有限公司
主分類號(hào)：	G10L15/26	分類號(hào)：	G10L15/26;G06F17/30
代理公司：	暫無信息	代理人：	暫無信息
地址：	518109 廣東省深圳市***	國(guó)省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	語音處理系統(tǒng) 裝置方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種語音處理系統(tǒng)，包括檔案讀取單元，所述檔案讀取單元用于選取音頻文件或視頻文件，其特征在于，還包括控制單元、標(biāo)簽文件生成單元、界面呈現(xiàn)單元，所述控制單元用于控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的發(fā)言者的身份，所述標(biāo)簽文件生成單元用于生成記錄每個(gè)預(yù)定時(shí)長(zhǎng)的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件，所述界面呈現(xiàn)單元用于生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋，所述控制單元還根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長(zhǎng)的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別。

2.如權(quán)利要求1所述的語音處理系統(tǒng)，其特征在于，當(dāng)所述檔案讀取單元讀取到視頻文件時(shí)，所述界面還包括每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的一幀圖像。

3.一種語音處理裝置，包括處理器、存儲(chǔ)器及語音處理芯片，其特征在于，所述處理器用于執(zhí)行以下操作：

根據(jù)用戶的操作選取音頻文件或視頻文件；

控制所述語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的發(fā)言者的身份；

生成記錄每個(gè)預(yù)定時(shí)長(zhǎng)的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件；

生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋；以及

根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長(zhǎng)的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別。

4.如權(quán)利要求3所述的語音處理裝置，其特征在于，當(dāng)所述檔案讀取單元讀取到視頻文件時(shí)，所述界面還包括每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的一幀圖像。

5.一種語音處理方法，包括：

根據(jù)用戶的操作選取音頻文件或視頻文件；

控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別，以確定每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的發(fā)言者的身份；

生成記錄每個(gè)預(yù)定時(shí)長(zhǎng)的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件；

生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋；以及

6.如權(quán)利要求5所述的語音處理方法，其特征在于，當(dāng)所述檔案讀取單元讀取到視頻文件時(shí)，所述界面還包括每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的一幀圖像。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鴻富錦精密工業(yè)（深圳）有限公司;鴻海精密工業(yè)股份有限公司，未經(jīng)鴻富錦精密工業(yè)（深圳）有限公司;鴻海精密工業(yè)股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310507989.0/1.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：鋁靶材組件的焊接方法
下一篇：極坐標(biāo)齒輪測(cè)量中心測(cè)頭偏置量的自動(dòng)校正方法

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識(shí)別；音頻分析或處理
G10L15-00 語音識(shí)別
G10L15-02 .語音識(shí)別的特征提取；識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識(shí)別系統(tǒng)，例如對(duì)說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】