[發明專利]一種基于K最近鄰算法生成逐字歌詞文件的系統與方法有效
| 申請號: | 201910979892.7 | 申請日: | 2019-10-15 |
| 公開(公告)號: | CN110853636B | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 馬哲;高超 | 申請(專利權)人: | 北京雷石天地電子技術有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G06K9/62;G11B27/10 |
| 代理公司: | 北京城烽知識產權代理事務所(特殊普通合伙) 11829 | 代理人: | 王新月 |
| 地址: | 100101 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 近鄰 算法 生成 逐字 歌詞 文件 系統 方法 | ||
本發明提供一種基于K最近鄰算法生成逐字歌詞文件的系統與方法,所述方法包括:獲取需要生成歌詞文件的音頻數據,再將所述的音頻數據至少分割成一個音頻片段,對所述音頻片段進行傅里葉變換,得到對應的頻域片段,獲取所述所有頻域片段能量在頻域分布范圍值,并利用K最近鄰算法檢測所有頻域片段能量在頻域分布范圍值的變動,從而檢測出所述音頻數據出現歌詞的時間節點,再結合所述音頻數據中的文字,將判斷所得的時間節點與所述文字根據先后次序一一對應,生成逐字歌詞文件。通過上述方案解決了目前歌詞文件逐字歌詞時長不精確的問題。
技術領域
本發明涉及音頻處理領域,尤其涉及一種基于K最近鄰算法生成逐字歌詞文件的系統與方法。
背景技術
K最近鄰算法的思想是,如果一個樣本在特征空間中的K個最相鄰的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。該方法在確定分類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。
現在mp3等音頻播放設備播放歌曲文件時,沒有逐字對應的歌詞,逐字歌詞需要人工制作。目前,通過音頻檢測文件核語音智能識別技術,可以實現所有歌曲自動生成逐字歌詞。但是,現有的歌詞字幕不能夠對歌曲中每個字的發音時長做出準確的判斷。比如當我們去KTV唱歌時,往往是通過某個字的顏色漸變等方法來表示這個字需要唱的時長,例如,該字字體顏色由白色逐漸變為藍色來表示這個字需要唱的時間,但是,由于現階段歌詞字幕往往是人工制作或者根據檢測音頻文件和語音智能識別自動生成的,存在歌曲文件逐字歌詞時長識別不精確的問題。
目前,針對上述問題,還沒有提出一種能夠有效解決問題的技術方案。
發明內容
本發明提供了一種基于K最近鄰算法生成逐字歌詞文件的系統與方法,可有效解決歌曲文件逐字歌詞時長識別不精確的問題。
一方面,本發明提供了一種基于K最近鄰算法生成逐字歌詞文件的系統,包括:
獲取模塊,用于獲取需要生成歌詞文件的音頻數據和所述音頻數據中的文字;
分割模塊,用于對所述的音頻數據根據預設分割時長進行分割,至少分割成一個音頻片段,所述分割所得的音頻片段總數至少為一倍的所述文字總數;
轉換模塊,用于對所述所有音頻片段進行傅里葉變換,得到對應的頻域片段;
判斷模塊,用于獲取所述所有頻域片段能量在頻域分布范圍值,并利用K最近鄰算法進行分類處理,判斷每一個頻域片段能量與其相鄰的至少一個頻域片段能量是否屬于同一個類別;
節點模塊,用于當所述待判斷頻域片段能量和與其相鄰的至少一個頻域片段能量在頻域分布范圍值不屬于同一個類別時,將該段頻域片段對應的時間設定為一個時間節點;
生成模塊,用于將判斷所得的時間節點與所述文字根據先后次序一一對應,生成逐字歌詞文件。
在一個實施例中,所述判斷模塊中,所述K最近鄰算法判斷是否屬于同一個類別的頻率片段數K值可通過循環迭代進行測試,選取通過判斷獲取的總的時間節點數等于所述文字數所對應的K值。
在一個實施例中,所述獲取模塊包括語音識別模塊,用于通過智能語音識別技術,識別所述音頻數據中的所有文字。
在一個實施例中,所述生成模塊包括:用于將判斷所得的所述時間節點與所述語音識別模塊識別的文字根據先后次序進行一一對應,生成逐字歌詞文件。
在一個實施例中,所述分割模塊的預設分割時長可根據所述音頻數據的舒緩程度設定。
另一方面,本發明還提供了一種基于K最近鄰算法生成逐字歌詞文件的方法,包括:
獲取需要生成歌詞文件的音頻數據和所述音頻數據中的文字;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京雷石天地電子技術有限公司,未經北京雷石天地電子技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910979892.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種混凝土自動出料裝置
- 下一篇:一種銻摻雜的二氧化錫氣凝膠-鈦電極制備方法





