[發(fā)明專利]語音處理系統(tǒng)、裝置及方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310507989.0 | 申請(qǐng)日: | 2013-10-25 |
| 公開(公告)號(hào): | CN103594086A | 公開(公告)日: | 2014-02-19 |
| 發(fā)明(設(shè)計(jì))人: | 林海興;董信宗 | 申請(qǐng)(專利權(quán))人: | 鴻富錦精密工業(yè)(深圳)有限公司;鴻海精密工業(yè)股份有限公司 |
| 主分類號(hào): | G10L15/26 | 分類號(hào): | G10L15/26;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518109 廣東省深圳市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 處理 系統(tǒng) 裝置 方法 | ||
1.一種語音處理系統(tǒng),包括檔案讀取單元,所述檔案讀取單元用于選取音頻文件或視頻文件,其特征在于,還包括控制單元、標(biāo)簽文件生成單元、界面呈現(xiàn)單元,所述控制單元用于控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的發(fā)言者的身份,所述標(biāo)簽文件生成單元用于生成記錄每個(gè)預(yù)定時(shí)長(zhǎng)的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件,所述界面呈現(xiàn)單元用于生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋,所述控制單元還根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長(zhǎng)的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別。
2.如權(quán)利要求1所述的語音處理系統(tǒng),其特征在于,當(dāng)所述檔案讀取單元讀取到視頻文件時(shí),所述界面還包括每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的一幀圖像。
3.一種語音處理裝置,包括處理器、存儲(chǔ)器及語音處理芯片,其特征在于,所述處理器用于執(zhí)行以下操作:
根據(jù)用戶的操作選取音頻文件或視頻文件;
控制所述語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的發(fā)言者的身份;
生成記錄每個(gè)預(yù)定時(shí)長(zhǎng)的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件;
生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋;以及
根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長(zhǎng)的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別。
4.如權(quán)利要求3所述的語音處理裝置,其特征在于,當(dāng)所述檔案讀取單元讀取到視頻文件時(shí),所述界面還包括每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的一幀圖像。
5.一種語音處理方法,包括:
根據(jù)用戶的操作選取音頻文件或視頻文件;
控制一語音處理芯片依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別,以確定每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的發(fā)言者的身份;
生成記錄每個(gè)預(yù)定時(shí)長(zhǎng)的部份與發(fā)言者的身份之對(duì)應(yīng)關(guān)系的標(biāo)簽文件;
生成一界面以呈現(xiàn)上述對(duì)應(yīng)關(guān)系以及接收用戶對(duì)上述對(duì)應(yīng)關(guān)系的反饋;以及
根據(jù)用戶對(duì)至少上述預(yù)定時(shí)長(zhǎng)的部份中之一與發(fā)言者的身份的對(duì)應(yīng)關(guān)系的反饋來控制所述語音處理芯片重新依序?qū)ψx取的音頻文件或視頻文件中的預(yù)定時(shí)長(zhǎng)的部份進(jìn)行聲紋識(shí)別。
6.如權(quán)利要求5所述的語音處理方法,其特征在于,當(dāng)所述檔案讀取單元讀取到視頻文件時(shí),所述界面還包括每個(gè)預(yù)定時(shí)長(zhǎng)的部份中的一幀圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鴻富錦精密工業(yè)(深圳)有限公司;鴻海精密工業(yè)股份有限公司,未經(jīng)鴻富錦精密工業(yè)(深圳)有限公司;鴻海精密工業(yè)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310507989.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





