[發(fā)明專利]一種精確到字的中文同步顯示歌詞方法有效
| 申請(qǐng)?zhí)枺?/td> | 200910089572.0 | 申請(qǐng)日: | 2009-07-24 |
| 公開(公告)號(hào): | CN101615417A | 公開(公告)日: | 2009-12-30 |
| 發(fā)明(設(shè)計(jì))人: | 史巖 | 申請(qǐng)(專利權(quán))人: | 北京海爾集成電路設(shè)計(jì)有限公司 |
| 主分類號(hào): | G11B27/10 | 分類號(hào): | G11B27/10;G11B27/34;G10H1/36 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100088北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 精確 中文 同步 顯示 歌詞 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及音頻播放領(lǐng)域,尤其涉及音頻播放系統(tǒng)中同步顯示歌詞的方法。
背景技術(shù)
播放軟件的歌詞顯示功能使得人們能夠在聽到優(yōu)美樂(lè)曲的同時(shí)看到音頻文件的歌詞,現(xiàn)在許多播放軟件都具有同步顯示歌詞的功能。具體方法是將歌詞存儲(chǔ)在一個(gè)純文本文件中,且在每句歌詞開始之前有一個(gè)以[MM:SS]格式呈現(xiàn)的時(shí)間標(biāo)簽,其中MM為被播放歌曲的時(shí)間分鐘值,SS為秒鐘值,當(dāng)歌詞播放到MM分SS秒時(shí)播放軟件便會(huì)顯示該句歌詞,進(jìn)而使得顯示的歌詞與人聲同步。
以上所述傳統(tǒng)同步顯示歌詞方法是按句記錄時(shí)間,然后將每句歌詞通過(guò)時(shí)間均分處理后再分配給每個(gè)字,故歌詞顯示只能精確到句而不能精確到字。然而目前有很多應(yīng)用場(chǎng)合如卡拉OK(電視歌曲伴奏設(shè)備)等,都需要一種按字正確顯示歌詞的播放軟件,而目前的同步顯示歌詞方法精度很差,幾乎不能正確顯示歌詞中每個(gè)字的時(shí)間。
發(fā)明內(nèi)容
本發(fā)明提供了一種能解決以上問(wèn)題的音頻播放系統(tǒng)中精確到字的中文同步顯示歌詞方法。
在第一方面,本發(fā)明提供了一種精確到字的中文同步顯示歌詞方法,該方法首先將每句歌詞的語(yǔ)音分割成若干部分,該若干部分的數(shù)量等于該句歌詞字?jǐn)?shù)加一個(gè)結(jié)尾換氣,并對(duì)分割成的每部分語(yǔ)音分別進(jìn)行匹配進(jìn)而得到匹配因子αx。然后再將每種分割得到的語(yǔ)音順次與該句歌詞中的每個(gè)字進(jìn)行音素匹配,并得到對(duì)應(yīng)的匹配程度βx。最后選取λ×αx+(1-λ)×βx值最大作為最優(yōu)劃分,其中λ為權(quán)重系數(shù)且滿足0≤λ≤1。
在本發(fā)明的一個(gè)實(shí)施例中,將最優(yōu)劃分中所對(duì)應(yīng)每一部分的起始時(shí)間作為歌詞中每個(gè)字的起始時(shí)間,并將該時(shí)間保存在存儲(chǔ)歌詞的純文本文件中。
在本發(fā)明的另一個(gè)實(shí)施例中,手動(dòng)調(diào)整純文本文件中歌詞字的起始時(shí)間,以便該歌詞字的顯示時(shí)間能夠更加同步于該歌詞字。
本發(fā)明利用精準(zhǔn)到句的原有歌詞,將每句歌詞的語(yǔ)音分割成與該歌詞音節(jié)相同的段,并綜合分割段匹配與音素匹配的匹配程度得到最優(yōu)劃分。進(jìn)而解決了同步顯示歌詞不能精確到字的問(wèn)題,在卡拉OK等需要同步顯示歌詞字的設(shè)備中具有重要應(yīng)用價(jià)值。
附圖說(shuō)明
下面將參照附圖對(duì)本發(fā)明的具體實(shí)施方案進(jìn)行更詳細(xì)的說(shuō)明,在附圖中:
圖1是精確到字的中文同步顯示歌詞流程圖。
具體實(shí)施方式
圖1是精確到字的中文同步顯示歌詞流程圖。
在步驟110,將歌詞劃分成若干句,每一句對(duì)應(yīng)一句歌詞。
較佳地,在步驟111對(duì)每句歌曲采用消除樂(lè)音算法以消除或減弱樂(lè)音而突出語(yǔ)音,所述消除樂(lè)音算法可以采用任意一種語(yǔ)音增強(qiáng)算法。
在步驟120,根據(jù)歌詞內(nèi)容統(tǒng)計(jì)每句歌詞的段數(shù),該段數(shù)包括每句歌結(jié)尾時(shí)的換氣,即該段數(shù)等于每句歌詞的字?jǐn)?shù)加一個(gè)結(jié)尾換氣。
在步驟130,將每句歌詞的語(yǔ)音分割成步驟120統(tǒng)計(jì)得到的段數(shù)個(gè)語(yǔ)音,并對(duì)分割后的每個(gè)語(yǔ)音進(jìn)行匹配,進(jìn)而得到多個(gè)匹配因子。
具體地,根據(jù)語(yǔ)音識(shí)別算法將所述每句歌詞的語(yǔ)音分割成若干部分,所述若干部分的具體數(shù)量等于步驟120統(tǒng)計(jì)得到的該句歌詞段數(shù),最優(yōu)分割為每個(gè)部分包括一個(gè)完整的音節(jié)即一個(gè)漢字或一個(gè)結(jié)尾換氣。
在語(yǔ)音識(shí)別算法分割每句歌詞語(yǔ)音的過(guò)程中有n種不同的可行分割,每一種分割所得到的音節(jié)都具有與其相對(duì)應(yīng)的匹配因子α,進(jìn)而得到該句歌詞語(yǔ)音的多種不同匹配因子α1,α2,α3,…,αn。該α值用于評(píng)價(jià)與其相對(duì)應(yīng)分割的優(yōu)劣,α值越大則說(shuō)明分割得越精確。
在步驟140,進(jìn)行音素(即每一個(gè)中文字符)匹配,得到不同的匹配程度β。
具體地,對(duì)步驟130中n種分割的每種分割所得到的音節(jié)按順序與該歌曲中每個(gè)字的音素進(jìn)行匹配,得到的匹配程度為β,故n種分割分別得到匹配程度β1,β2,β3,…,βn。所述匹配程度方法可以為任意一種語(yǔ)音匹配算法。
在步驟150,將α與β按照一定的權(quán)重,并通過(guò)設(shè)定閾值進(jìn)而確定最優(yōu)劃分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京海爾集成電路設(shè)計(jì)有限公司,未經(jīng)北京海爾集成電路設(shè)計(jì)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910089572.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種用于帶壓條件下的三相分離裝置
- 下一篇:硝基苯刮水裝置
- 同類專利
- 專利分類
G11B 基于記錄載體和換能器之間的相對(duì)運(yùn)動(dòng)而實(shí)現(xiàn)的信息存儲(chǔ)
G11B27-00 編輯;索引;尋址;定時(shí)或同步;監(jiān)控;磁帶行程的測(cè)量
G11B27-02 .編輯,例如,改變記錄在記錄載體上或從記錄載體上重現(xiàn)的信息信號(hào)的次序
G11B27-10 .索引;尋址;定時(shí)或同步;磁帶行程的測(cè)量
G11B27-36 .監(jiān)控;即監(jiān)控記錄或重現(xiàn)的進(jìn)程
G11B27-11 ..利用在記錄載體上檢測(cè)不到的信息的
G11B27-19 ..利用在記錄載體上可檢測(cè)到的信息的





