[發(fā)明專利]一種提取會(huì)議中最重要嘉賓語(yǔ)音的方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201410231431.9 | 申請(qǐng)日: | 2014-05-28 |
| 公開(kāi)(公告)號(hào): | CN104021785A | 公開(kāi)(公告)日: | 2014-09-03 |
| 發(fā)明(設(shè)計(jì))人: | 李艷雄;金海;賀前華;王琴 | 申請(qǐng)(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號(hào): | G10L15/02 | 分類號(hào): | G10L15/02 |
| 代理公司: | 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 蔡茂略 |
| 地址: | 510640 廣*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 提取 會(huì)議 最重要 嘉賓 語(yǔ)音 方法 | ||
1.一種提取會(huì)議中最重要嘉賓語(yǔ)音的方法,其特征在于,包括如下步驟:
S1、讀入記錄有會(huì)議語(yǔ)音的音頻文件;
S2、說(shuō)話人分割:檢測(cè)上述會(huì)議語(yǔ)音中的說(shuō)話人改變點(diǎn),將相鄰兩個(gè)改變點(diǎn)之間的語(yǔ)音樣點(diǎn)作為一個(gè)語(yǔ)音段,將音頻文件分成J個(gè)語(yǔ)音段,并將這J個(gè)語(yǔ)音段按時(shí)長(zhǎng)從大到小的順序編號(hào)得到排序后的語(yǔ)音段xj,1≤j≤J,x1和x2分別是最長(zhǎng)和第二長(zhǎng)的語(yǔ)音段,以此類推;
S3、語(yǔ)音段的距離比較及合并:比較語(yǔ)音段x1與語(yǔ)音段x2的距離,根據(jù)該距離與門(mén)限的關(guān)系判斷語(yǔ)音段x1與語(yǔ)音段x2是否都是最重要嘉賓的語(yǔ)音,再根據(jù)其他語(yǔ)音段xj與語(yǔ)音段x1和語(yǔ)音段x2的距離,判斷其他語(yǔ)音段xj是不是最重要嘉賓的語(yǔ)音,從而實(shí)現(xiàn)最重要嘉賓語(yǔ)音的提取,其中,3≤j≤J。
2.根據(jù)權(quán)利要求1所述的提取會(huì)議中最重要嘉賓語(yǔ)音的方法,其特征在于,所述S2說(shuō)話人分割:檢測(cè)上述會(huì)議語(yǔ)音中的說(shuō)話人改變點(diǎn),將相鄰兩個(gè)改變點(diǎn)之間的語(yǔ)音樣點(diǎn)作為一個(gè)語(yǔ)音段,將音頻文件分成多個(gè)語(yǔ)音段,具體為:
S2.1利用基于門(mén)限判決的語(yǔ)音檢測(cè)算法從上述音頻文件中找出靜音段和語(yǔ)音段;
S2.2將上述語(yǔ)音段按時(shí)間順序拼接成一個(gè)長(zhǎng)語(yǔ)音段,并從長(zhǎng)語(yǔ)音段中提取音頻特征;
S2.3利用上述提取的音頻特征,根據(jù)貝葉斯信息準(zhǔn)則,判斷長(zhǎng)語(yǔ)音段中相鄰數(shù)據(jù)窗之間的相似度來(lái)檢測(cè)說(shuō)話人改變點(diǎn);
S2.4依次把相鄰兩個(gè)改變點(diǎn)之間的語(yǔ)音樣點(diǎn)作為一個(gè)語(yǔ)音段,從而將音頻文件分割成多個(gè)語(yǔ)音段,且每個(gè)語(yǔ)音段包含一個(gè)說(shuō)話人。
3.根據(jù)權(quán)利要求2所述的提取會(huì)議中最重要嘉賓語(yǔ)音的方法,其特征在于,所述S2.1利用基于門(mén)限判決的語(yǔ)音檢測(cè)算法從上述音頻文件中找出靜音段和語(yǔ)音段,具體包括如下步驟:
S2.1.1對(duì)讀入的會(huì)議語(yǔ)音進(jìn)行分幀,并計(jì)算每幀語(yǔ)音的能量,得到會(huì)議語(yǔ)音的能量特征矢量;
S2.1.2計(jì)算每幀語(yǔ)音的能量門(mén)限;
S2.1.3將每幀語(yǔ)音的能量與能量門(mén)限進(jìn)行比較,低于能量門(mén)限的幀為靜音幀,否則為語(yǔ)音幀,將所有的靜音幀都舍棄,將語(yǔ)音幀按時(shí)間順序拼接成一個(gè)語(yǔ)音段。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410231431.9/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 一種實(shí)現(xiàn)視頻會(huì)議資源調(diào)度的方法
- 一種會(huì)議系統(tǒng)的實(shí)現(xiàn)方法
- 視頻會(huì)議跨級(jí)控制方法及系統(tǒng)
- 一種用應(yīng)用服務(wù)器實(shí)現(xiàn)子會(huì)議功能的方法和系統(tǒng)
- 一種通過(guò)互動(dòng)式語(yǔ)音應(yīng)答接入會(huì)議的方法及系統(tǒng)
- 基于SIP協(xié)議的分布式會(huì)議方法
- 會(huì)議控制方法和裝置
- 待召開(kāi)會(huì)議的會(huì)議議程生成方法以及裝置
- 會(huì)議控制方法和裝置
- 會(huì)議流程的管理方法、裝置、存儲(chǔ)介質(zhì)及服務(wù)器
- 一種應(yīng)用有源RFID標(biāo)簽的婚慶嘉賓自動(dòng)播報(bào)系統(tǒng)
- 一種應(yīng)用有源RFID標(biāo)簽的婚慶嘉賓自動(dòng)播報(bào)系統(tǒng)
- 顯示嘉賓猜測(cè)比分的方法和裝置
- 顯示嘉賓猜測(cè)比分的方法和裝置
- 一種直播處理方法、裝置、終端設(shè)備及系統(tǒng)
- 一種新型藍(lán)牙控制雙面差異顯示的電子嘉賓牌
- 用于手機(jī)的嘉賓組織者展示的圖形用戶界面
- 一種演講效果評(píng)估系統(tǒng)
- 演講效果評(píng)估方法、裝置、評(píng)估設(shè)備以及可讀存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)交友互動(dòng)方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)





