[發明專利]基于語音平臺識別背景音樂的方法、裝置及系統在審
| 申請號: | 202011509875.6 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112634893A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 李遠程;林初燃;劉志堅;馮楓杰 | 申請(專利權)人: | 寧波向往智匯科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G10L25/33;G06F16/632;G06F16/68;G06F16/683 |
| 代理公司: | 重慶強大凱創專利代理事務所(普通合伙) 50217 | 代理人: | 岳兵 |
| 地址: | 315000 浙江省寧波*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語音 平臺 識別 背景音樂 方法 裝置 系統 | ||
本發明涉及語音交互技術領域,具體涉及一種基于語音平臺識別背景音樂的方法、裝置及系統,所述方法包括如下步驟:S1、通過采集用戶的哼唱語音,將哼唱語音暫存在待識別序列中;S2、通過語音平臺接收語音指令,響應所述語音平臺根據語音指令下發的識別指令;S3、通過采集音頻數據,判斷音頻數據的時長是否大于預設時間閾值,如果是,則直接對音頻數據進行歌曲識別,生成并輸出識別結果;如果不是,則提取哼唱語音進行識別,得到第一結果清單,再識別音頻數據得到第二結果清單,提取第一結果清單和第二結果清單中名稱相同的歌曲信息,生成識別結果。采用本方案能夠解決用戶體驗不高的問題。
技術領域
本發明涉及語音交互技術領域,具體涉及一種基于語音平臺識別背景音樂的方法、裝置及系統。
背景技術
隨著互聯網技術的不斷發展,通過網絡觀看視頻的用戶越來越多,但是用戶在觀看視頻的過程中可能會遇到如下情況:視頻播放中有一段很好聽的背景音樂或插曲,用戶會對當前播放的背景音樂感興趣,希望獲取到該音樂的詳細信息,比如歌曲名稱、作者、歌曲風格、專輯名稱等信息。
對此,中國專利公開號為CN108509620A的文件中公開了一種歌曲識別方法及裝置、存儲介質,屬于電子技術領域。所述方法包括:在終端的顯示界面的頂層顯示歌曲識別提示信息;在檢測到對所述歌曲識別提示信息的觸發操作后,通過所述終端采集音頻數據,并對采集到的音頻數據進行歌曲識別。
采用上述方案,可以通過終端采集音頻數據,并對采集到的音頻數據進行歌曲識別;類似于各大音樂播放軟件中集成的聽音識曲功能,能夠幫助用戶了解到背景音樂的相關信息。但不可避免的是,用戶有時會在音樂快要結束時才進行聽音識曲,而由于打開軟件需要一定時間,導致采集音頻數據的時長無法達到軟件要求(常規的需要控制在至少15秒),存在識別準確性偏低,甚至無法識別出音樂信息的問題,所以用戶不得不重新開始播放原始音樂進行識別,極大地影響用戶體驗。
發明內容
本發明意在于提供一種基于語音平臺識別背景音樂的方法、裝置及系統,能夠解決用戶體驗不高的問題。
本發明提供的基礎方案為:基于語音平臺識別背景音樂的方法,包括如下步驟:
S1、通過采集用戶的哼唱語音,將哼唱語音暫存在待識別序列中;
S2、通過語音平臺接收語音指令,響應所述語音平臺根據語音指令下發的識別指令;
S3、通過采集音頻數據,判斷音頻數據的時長是否大于預設時間閾值,如果是,則直接對音頻數據進行歌曲識別,生成并輸出識別結果;如果不是,則提取哼唱語音進行識別,得到第一結果清單,再識別音頻數據得到第二結果清單,提取第一結果清單和第二結果清單中名稱相同的歌曲信息,生成識別結果。
本發明的工作原理及優點在于:
本方案中,首先獲取用戶在跟唱時的哼唱語音,并在待識別序列中暫存該哼唱語音;然后由語音平臺接收用戶的語音指令,并下發識別指令,進行背景音樂的識別工作;通過采集背景音樂的音頻數據,判斷音頻時長與預設時間閾值的關系,如果時長大于預設時間閾值,表示采集到的音頻數據時長足夠進行聽音識曲,可以直接對該音頻數據進行歌曲識別,得到識別結果;相反的,如果時長不大于預設閾值,說明音頻時長無法達到要求,需要提取并識別哼唱語音,得到較為模糊的結果,生成第一結果清單(即第一結果清單主要是根據用戶哼唱聲識別出多個粗略的歌曲名,清單中集合了多個近似的歌曲名);再對音頻數據進行識別,得到第二結果清單(第二結果清單則主要是根據短暫的音頻數據另外識別出的多個歌曲名,清單中同樣集合了多個近似的歌曲名);于是將兩部分結果中名稱相同的歌曲信息,作為識別結果;得到結果準確性更高,有效避免音頻時長不足導致無法識別的問題;同時,用戶也不必重新開始播放音樂,從而提升用戶的使用體驗。
進一步,還包括步驟S4、背景音樂結束后清空待識別序列中的哼唱語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于寧波向往智匯科技有限公司,未經寧波向往智匯科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011509875.6/2.html,轉載請聲明來源鉆瓜專利網。





