[發(fā)明專利]基于多策略的新廣告發(fā)現(xiàn)方法、電子設備和可讀存儲介質有效
| 申請?zhí)枺?/td> | 202110463040.X | 申請日: | 2021-04-27 |
| 公開(公告)號: | CN113194332B | 公開(公告)日: | 2022-04-29 |
| 發(fā)明(設計)人: | 鄭嚴;殷松遷;李國華;郭忠武;姜衛(wèi)平;王榮芳;韓煜 | 申請(專利權)人: | 北京市博匯科技股份有限公司 |
| 主分類號: | H04N21/233 | 分類號: | H04N21/233;H04N21/234;H04N21/439;H04N21/44;H04N21/81;G06Q30/02;G10L25/51;G10L25/57;G10L15/16;G10L15/26 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 董艷芳 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 策略 廣告 發(fā)現(xiàn) 方法 電子設備 可讀 存儲 介質 | ||
1.一種基于多策略的新廣告發(fā)現(xiàn)方法,其特征在于,包括:
從樣本數(shù)據(jù)庫中提取出廣告片段;
根據(jù)每段廣告片段的播出時間,提取出每段所述廣告片段的聲紋特征;
通過廣告語音模板對每段所述廣告片段的聲紋特征逐一進行匹配,以從所述廣告片段中選擇出未知廣告片段,所述廣告語音模板是根據(jù)已知聲紋特征生成;
運用語音識別模型計算每段所述未知廣告片段的聲音邊界時間點;
依據(jù)聲音邊界時間點對所述未知廣告片段進行分段,得到未知片段;
分別計算每段所述未知片段的策略特征屬性信息,所述策略特征屬性信息包括以下的任意一種或多種:播放時間長度、片段重復性、廣告關鍵詞、文本分類;
根據(jù)每段所述未知片段的策略特征屬性信息,從所述未知片段中確定新廣告。
2.根據(jù)權利要求1所述的基于多策略的新廣告發(fā)現(xiàn)方法,其特征在于,通過廣告語音模板對每段所述廣告片段的聲紋特征逐一進行匹配,以從所述廣告片段中選擇出未知廣告片段,包括:
針對每段所述廣告片段,將該段廣告片段的聲紋特征與已知聲紋進行特征匹配,所述已知聲紋是根據(jù)存儲在樣本數(shù)據(jù)庫中的已知廣告生成;
若聲紋特征匹配結果不同,則確定所述廣告片段為未知廣告片段。
3.根據(jù)權利要求2所述的基于多策略的新廣告發(fā)現(xiàn)方法,其特征在于,運用語音識別模型計算每段所述未知廣告片段的聲音邊界時間點,包括:
針對每段所述未知廣告片段,根據(jù)語音識別模型計算每段所述未知廣告片段在每個時間點的分貝值;
針對每段所述未知廣告片段,根據(jù)該段未知廣告片段在每個時間點的聲音分貝值,判斷該段未知廣告片段中分貝值小于預設數(shù)值的目標時間點;
針對每段所述未知廣告片段,根據(jù)該段未知廣告片段的目標時間點,確定該段未知廣告片段的邊界時間點;
根據(jù)每段所述未知廣告片段的邊界時間點,對所述未知廣告片段進行分段,得到未知片段。
4.根據(jù)權利要求1所述的基于多策略的新廣告發(fā)現(xiàn)方法,其特征在于,所述策略特征屬性信息包括播放時間長度,根據(jù)每段所述未知片段的策略特征屬性信息,從所述未知片段中確定新廣告,包括:
若所述未知片段的播放時間長度小于廣告播放時長的固定秒數(shù),則所述未知片段為新廣告。
5.根據(jù)權利要求1所述的基于多策略的新廣告發(fā)現(xiàn)方法,其特征在于,所述策略特征屬性信息包括片段重復性,根據(jù)每段所述未知片段的策略特征屬性信息,從所述未知片段中確定新廣告,包括:
針對每段所述未知片段,通過所述廣告片段的廣告語音模板逐一進行聲紋特征遍歷;
若每段所述未知片段的遍歷結果與所述廣告片段的廣告語音模板的聲紋特征相同,則通過視頻分割器將該未知片段 視頻分割為兩段新的子片段;
針對每段所述未知片段,統(tǒng)計其分割所述子片段播出的重復性,重復播出次數(shù)大于1,則確定為新廣告。
6.根據(jù)權利要求1所述的基于多策略的新廣告發(fā)現(xiàn)方法,其特征在于,所述策略特征屬性信息包括廣告關鍵詞,根據(jù)每段所述未知片段的策略特征屬性信息,從所述未知片段中確定新廣告,包括:
獲取每段所述未知片段中廣告關鍵詞文字信息;
統(tǒng)計所述文字信息出現(xiàn)時長;
計算所述文字信息出現(xiàn)時長與所述未知片段總時長的占比;
根據(jù)時長占比,確定所述未知片段為新廣告。
7.根據(jù)權利要求6所述的基于多策略的新廣告發(fā)現(xiàn)方法,其特征在于,獲取每段所述未知片段中廣告關鍵詞文字信息,包括:
所述未知片段中廣告關鍵詞的文字信息包括以下的任意一種或多種:
廣告、公益廣告字樣;
產(chǎn)品名稱、金額;
聯(lián)系方式:電話、QQ、微信、郵箱、網(wǎng)址。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市博匯科技股份有限公司,未經(jīng)北京市博匯科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110463040.X/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 知識發(fā)現(xiàn)裝置、知識發(fā)現(xiàn)程序和知識發(fā)現(xiàn)方法
- 規(guī)則發(fā)現(xiàn)程序、規(guī)則發(fā)現(xiàn)處理和規(guī)則發(fā)現(xiàn)裝置
- 發(fā)現(xiàn)協(xié)議
- 對等發(fā)現(xiàn)
- 小區(qū)發(fā)現(xiàn)
- 漏洞發(fā)現(xiàn)裝置、漏洞發(fā)現(xiàn)方法以及漏洞發(fā)現(xiàn)程序
- 使用發(fā)現(xiàn)節(jié)點的設備發(fā)現(xiàn)
- 漏洞發(fā)現(xiàn)裝置、漏洞發(fā)現(xiàn)方法以及存儲介質
- 用于提供虛擬場景的裝置及方法
- 接入語音服務的方法、裝置和數(shù)據(jù)載體





