[發(fā)明專利]音頻定位的方法、裝置、終端設(shè)備及服務(wù)器有效
| 申請?zhí)枺?/td> | 202010197245.3 | 申請日: | 2020-03-19 |
| 公開(公告)號: | CN111429941B | 公開(公告)日: | 2023-08-22 |
| 發(fā)明(設(shè)計)人: | 鄭羲光;張晨 | 申請(專利權(quán))人: | 北京達佳互聯(lián)信息技術(shù)有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/48 |
| 代理公司: | 華進聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 方高明 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 定位 方法 裝置 終端設(shè)備 服務(wù)器 | ||
1.一種音頻定位的方法,其特征在于,所述方法應(yīng)用于終端設(shè)備,所述方法包括:
當(dāng)檢測到用戶的直播互動操作時,采集第一預(yù)設(shè)時長的直播音頻;
將所述直播音頻劃分為多個子直播音頻;
針對每個子直播音頻,確定該子直播音頻對應(yīng)的音頻指紋集合;
根據(jù)該子直播音頻對應(yīng)的音頻指紋集合和服務(wù)器發(fā)送的各基準(zhǔn)直播音頻對應(yīng)的音頻指紋集合,確定該子直播音頻對應(yīng)的目標(biāo)直播音頻;
如果所述直播音頻包含的各子直播音頻對應(yīng)的目標(biāo)直播音頻的直播起止時段存在連續(xù)性,則根據(jù)各目標(biāo)直播音頻的直播起止時段,確定所述直播音頻對應(yīng)的直播起止時段,并作為用戶的直播互動操作對應(yīng)的直播互動時段。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述直播音頻劃分為多個子直播音頻,包括:
根據(jù)所述直播音頻對應(yīng)的第一起始時刻和預(yù)設(shè)的音頻劃分步幅,確定各子直播音頻對應(yīng)的第二起始時刻;
根據(jù)各子直播音頻對應(yīng)的第二起始時刻和預(yù)設(shè)的子直播音頻的時長,將所述直播音頻劃分為多個子直播音頻。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述針對每個子直播音頻,確定該子直播音頻對應(yīng)的音頻指紋集合,包括:
針對每個子直播音頻,在該子直播音頻對應(yīng)的頻譜圖中,確定該子直播音頻對應(yīng)的能量峰值點集合;
根據(jù)所述能量峰值點集合中各能量峰值點的頻率和所述各能量峰值點之間的時間差,計算所述各能量峰值點對應(yīng)的音頻指紋,組成該子直播音頻對應(yīng)的音頻指紋集合。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)該子直播音頻對應(yīng)的音頻指紋集合和服務(wù)器發(fā)送的各基準(zhǔn)直播音頻對應(yīng)的音頻指紋集合,確定該子直播音頻對應(yīng)的目標(biāo)直播音頻,包括:
針對該子直播音頻對應(yīng)的音頻指紋集合中的每個音頻指紋,在服務(wù)器發(fā)送的各基準(zhǔn)直播音頻對應(yīng)的音頻指紋集合中,確定音頻指紋集合包含該音頻指紋的基準(zhǔn)直播音頻,作為該子直播音頻對應(yīng)的候選直播音頻;
按照重復(fù)次數(shù)由高到低的順序,在該子直播音頻對應(yīng)的候選直播音頻中,選擇預(yù)設(shè)數(shù)目個候選直播音頻,作為該子直播音頻對應(yīng)的目標(biāo)直播音頻。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
獲取終端設(shè)備的當(dāng)前時間和直播延遲時間;
根據(jù)所述當(dāng)前時間和直播延遲時間,確定直播時間,并根據(jù)所述直播時間和第二預(yù)設(shè)時長,確定定位時段;
在服務(wù)器發(fā)送的各基準(zhǔn)直播音頻中,將直播起止時段位于所述定位時段內(nèi)的基準(zhǔn)直播音頻,確定為定位直播音頻;
所述根據(jù)該子直播音頻對應(yīng)的音頻指紋集合和服務(wù)器發(fā)送的各基準(zhǔn)直播音頻對應(yīng)的音頻指紋集合,確定該子直播音頻對應(yīng)的目標(biāo)直播音頻,包括:
根據(jù)該子直播音頻對應(yīng)的音頻指紋集合和各定位直播音頻對應(yīng)的音頻指紋集合,確定該子直播音頻對應(yīng)的目標(biāo)直播音頻。
6.一種音頻定位的方法,其特征在于,所述方法應(yīng)用于服務(wù)器,所述方法包括:
在直播互動時段內(nèi),周期性獲取預(yù)設(shè)時長的基準(zhǔn)直播音頻和所述基準(zhǔn)直播音頻對應(yīng)的直播起止時段,所述直播起止時段為直播互動的開始時刻至結(jié)束時刻之間的時間段;
針對每個基準(zhǔn)直播音頻,確定該基準(zhǔn)直播音頻對應(yīng)的音頻指紋集合;
接收終端設(shè)備發(fā)送的直播音頻包含的各子直播音頻的音頻指紋集合,所述直播音頻為當(dāng)檢測到用戶的直播互動操作時,所述終端設(shè)備采集的直播音頻;
針對每個子直播音頻,根據(jù)該子直播音頻對應(yīng)的音頻指紋集合和各基準(zhǔn)直播音頻對應(yīng)的音頻指紋集合,確定該子直播音頻對應(yīng)的目標(biāo)直播音頻;
如果所述直播音頻包含的各子直播音頻對應(yīng)的目標(biāo)直播音頻的直播起止時段存在連續(xù)性,則根據(jù)各目標(biāo)直播音頻的直播起止時段,確定所述直播音頻對應(yīng)的直播起止時段,并作為用戶的直播互動操作對應(yīng)的直播互動時段;
將所述用戶的直播互動操作對應(yīng)的直播互動時段發(fā)送至所述終端設(shè)備。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京達佳互聯(lián)信息技術(shù)有限公司,未經(jīng)北京達佳互聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010197245.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





