[發明專利]一種視頻語義挖掘方法無效
| 申請號: | 201110168952.0 | 申請日: | 2011-06-22 |
| 公開(公告)號: | CN102222101A | 公開(公告)日: | 2011-10-19 |
| 發明(設計)人: | 張師林 | 申請(專利權)人: | 北方工業大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100144 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 語義 挖掘 方法 | ||
1.一種視頻語義挖掘方法,其特征在于,所述方法的步驟如下:
步驟S1:對于待處理的視頻,分別進行中文連續語音識別、視頻目標識別和視頻文字識別;
步驟S2:對于步驟S1所述的三種識別結果,各自表達為一個文字向量,共同組成一個張量以表達視頻;
步驟S3:對于步驟S2中的三個文字向量,分別進行中文分詞和詞性標注,保留名詞和動詞;
步驟S4:構造圖模型來表達視頻,其中圖的頂點為S3中所得到的名詞和動詞,圖的邊權重設置為兩個頂點所代表的中文詞語的語義距離;
步驟S5:對于步驟S4所構造的圖模型,使用稠密子圖發現算法挖掘圖模型中的語義。
2.根據權利要求1所述的視頻語義挖掘方法,其特征在于,所述視頻目標識別首先在視覺目標分類挑戰賽圖片庫(PASCAL?VOC?Challenge?2010)上提取圖片的梯度特征(HOG)和尺度不變特征(SIFT),并對于這些特征使用均值聚類(K-means)算法聚類,稱這些類為視覺單詞,然后使用這些視覺單詞構造詞袋(bag?of?words)對圖片庫中的圖片進行描述,以詞袋為圖像特征訓練支撐向量機模型(SVM),使用支撐向量機模型對視頻鏡頭關鍵幀圖像進行目標識別。
3.根據權利要求1所述的視頻語義挖掘方法,其特征在于,對于視頻的處理融合了中文連續語音識別、視頻目標識別和視頻文字識別,并且把三種識別結果統一作為文字特征來處理,文字處理包括中文分詞和詞性標注。
4.根據權利要求1所述的視頻語義挖掘方法,其特征在于,對于圖模型的構造,頂點代表了視頻三種識別結果中的名詞和動詞,邊的權重代表了頂點之間的語義距離,邊的權重計算采取的是基于“知網”的語義度量方法,通過查詢“知網”語義辭典中詞語之間的層次和隸屬關系來計算兩個詞語之間的語義距離。
5.根據權利要求1所述的視頻語義挖掘方法,其特征在于,稠密子圖的發現算法是通過不斷地去除圖模型中孤立的頂點來實現的,視頻語義的挖掘過程表達為圖模型中稠密子圖的發現問題。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北方工業大學,未經北方工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110168952.0/1.html,轉載請聲明來源鉆瓜專利網。





