[發(fā)明專利]基于內(nèi)容的音頻比對系統(tǒng)在審
| 申請?zhí)枺?/td> | 201710833520.4 | 申請日: | 2017-09-15 |
| 公開(公告)號: | CN107749300A | 公開(公告)日: | 2018-03-02 |
| 發(fā)明(設計)人: | 姜克建;陳武 | 申請(專利權(quán))人: | 蘇州市福川科技有限公司 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L25/18;G10L25/24;G10L25/60;G10L25/81;H04H20/14 |
| 代理公司: | 北京華仲龍騰專利代理事務所(普通合伙)11548 | 代理人: | 李靜 |
| 地址: | 215000 江蘇省蘇州市*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 內(nèi)容 音頻 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及廣播服務系統(tǒng),具體為基于內(nèi)容的音頻比對系統(tǒng),屬于廣播校正領(lǐng)域。
背景技術(shù)
由于無線電的廣泛使用以及人們對于大功率發(fā)射機和高靈敏度電子管接收機技能的熟練掌握,使廣播逐漸變成了現(xiàn)實。1919年,蘇聯(lián)制造了一臺大功率發(fā)射機,并于1920年在莫斯科開始試驗性廣播。1920年6月15日,馬可尼公司在英國舉辦了一個以梅爾芭太太主演的“無線電--電話”音樂會,遠至巴黎、意大利、挪威,甚至在希臘都能清晰的收聽到。這就是廣播事業(yè)的開始。1920年11月2日,美國在康拉德的指導下,威斯汀豪斯公司廣播站KDKA開始廣播,首次播送的節(jié)目是哈丁-科克斯總統(tǒng)選舉,在當時,這事曾轟動一時。1920年12月22日,德國的柯尼武斯特豪森廣播電臺首次播送了器樂演奏音樂會。1922年11月14日,倫敦ZLO廣播站正式開始在英國廣播每日節(jié)目,該站在1927年改為英國廣播有限公司,即BBC。1922年法國埃菲爾鐵塔也正式開始播音。1927年止,美國國內(nèi)已擁有737個廣播站。
這一時期,廣播站如雨后春筍在各國中相繼涌現(xiàn)。當時,在歐洲廣播已被視為一個龐大的通信工具。以后,全世界的廣播事業(yè)不斷發(fā)展,現(xiàn)已逐步形成全球性的廣播網(wǎng)。
在廣播的發(fā)展歷程中,廣播的播出安全一直是個重點課題,現(xiàn)有技術(shù)是通過對終端播出聲音與現(xiàn)場實時聲音進行人工比對,來保證播出安全的,但人工比對容易出現(xiàn)誤差,而且容易因為操作人員的疏忽造成播出事故。目前還沒有一種可以通過內(nèi)容進行比對的基于內(nèi)容的音頻比對系統(tǒng)。
發(fā)明內(nèi)容
本發(fā)明的目的就在于為了解決上述問題而提供一種基于內(nèi)容的音頻比對系統(tǒng)。
本發(fā)明通過以下技術(shù)方案來實現(xiàn)上述目的,基于內(nèi)容的音頻比對系統(tǒng),包括以下步驟:信號輸入、預處理、音頻比對、參數(shù)輸出,其特征在于在信號輸入步驟主要包括參考音頻輸入、比對音頻輸入,所述參考音頻輸入主要通過播出現(xiàn)場進行采集后直接轉(zhuǎn)換成聲音信號作為現(xiàn)場音頻源,所述比對音頻輸入主要通過廣播收集終端對無線信號進行采集后再轉(zhuǎn)換成聲音信號作為廣播音頻源;在預處理步驟包括過零率檢測以及延時量計算;在音頻比對步驟,對音頻源通過滑動時間窗口進行分析比對,分析比對過程中,主要通過過門限統(tǒng)計、短時能量分析、誤差信號分析、譜特征分析、倒譜特征分析、人耳聽覺特征加權(quán)進行分析比對;在參數(shù)輸出步驟,對分析比對結(jié)果進行直觀輸出。所述參數(shù)輸出步驟主要輸出預處理步驟計算出的延時量、現(xiàn)場音頻源與廣播音頻源的相似度判決值。所述參數(shù)輸出步驟同時輸出相位監(jiān)測值、停播監(jiān)測、雜音監(jiān)測、單音監(jiān)測。所述預處理步驟中的延時量計算結(jié)果直接通過參數(shù)輸出步驟輸出。
本發(fā)明所述基于內(nèi)容的音頻比對系統(tǒng)大量借鑒了語音識別技術(shù),采用基于樣本的音頻內(nèi)容對比算法技術(shù),對同源音頻進行比較,可行性高,同時,AoIP技術(shù)的應用令廣播鏈路上高質(zhì)量信號的采集更為簡單易行,直接為對比技術(shù)提供了更豐富可行的對比特征,而且采用數(shù)字信號處理技術(shù),容易實現(xiàn)播出信號質(zhì)量的全面監(jiān)控,可行保證了播出安全,杜絕了播出事故。
附圖說明
附圖中,圖1是本發(fā)明的流程框圖。
具體實施方式
下面結(jié)合具體實施例對本發(fā)明中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
以快速跳變型、慢速純音樂、男生說話聲、女生說話聲為例采用本發(fā)明所述基于內(nèi)容的音頻比對系統(tǒng)進行音頻比對,其中快速跳變型音頻主要有鼓聲、吉他、電吉他、鋼琴、古箏類打擊樂器或彈撥樂器,慢速純音樂主要有小提琴、大提琴類樂器。采用音頻長度3821S的男女聲歌曲、音頻長度3415S的輕音樂、音頻長度3765S的音樂會現(xiàn)場錄音、音頻長度3567S的新聞聯(lián)播節(jié)目作為實驗資料,在幀長(短時平穩(wěn)長度):20ms,幀移:10ms,搜索深度:30s,對比片段長度(滑動窗):5s,搜索步長:10ms,監(jiān)測間隔:1s,計算音頻帶寬:5kHz,雙聲道音頻打分結(jié)果取二者平均,特征:MFCC(14)+DeltaMFCC(14) ,粗搜索精度:10ms,精搜索精度:1ms的條件下,進行音頻比對,延遲估計精度如下表所示。
表1延遲估計精度:
不同信噪比條件下系統(tǒng)每小時報警(連續(xù)三次比對超出門限)次數(shù)如下:
表2不同信噪比條件下系統(tǒng)每小時報警平均次數(shù)
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州市福川科技有限公司,未經(jīng)蘇州市福川科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710833520.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設備和內(nèi)容接收設備
- 內(nèi)容服務系統(tǒng)、內(nèi)容服務器、內(nèi)容終端及內(nèi)容服務方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





