[發明專利]一種針對講座視頻的時間軸自動產生方法在審
| 申請號: | 201410423661.5 | 申請日: | 2014-08-26 |
| 公開(公告)號: | CN104159145A | 公開(公告)日: | 2014-11-19 |
| 發明(設計)人: | 程國艮;袁翔宇;王宇晨 | 申請(專利權)人: | 中譯語通科技(北京)有限公司 |
| 主分類號: | H04N21/434 | 分類號: | H04N21/434;H04N21/435;H04N21/80;G11B27/10 |
| 代理公司: | 北京知本村知識產權代理事務所 11039 | 代理人: | 周自清 |
| 地址: | 100040 北京市石景山區八*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 針對 講座 視頻 時間 自動 產生 方法 | ||
1.一種針對講座視頻的時間軸自動產生方法,其特征在于,包括以下步驟:
第一步,掃描一遍視頻,通過小波變換和自相關函數法檢測出基音頻率;
第二步,尋找基音頻率的平均值μ和標準差σ,作為講話人的基因頻率;
第三步,根據基音頻率,進行初劃分,劃分為時間軸單元;
第四步,對于每一個時間軸單元,計算其基音頻率相似性A及頻譜相似性B,所述頻率相似性A,既是該時間軸的基音平均頻率,在以第二步計算得到的,基音頻率的平均值μ和標準差σ所得到的正態分布上,所出現的概率;所述頻譜相似性B的計算方式如下:每個時間軸由N幀組成,計算每一幀與前一幀的基因頻率差的平均值D;取一個閾值K,當D<K時,B?=?1,當D>K時,B按線性衰減;對于A,B取兩個閾值,當A和B均大于這兩個閾值時,認為是演講人在說話,排除非演講人說話的時間軸,得到的時間軸為演講人說話的時間軸。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中譯語通科技(北京)有限公司,未經中譯語通科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410423661.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:開放式可插拔的轉接板
- 下一篇:視頻編碼方法和視頻解碼方法及其裝置





