[發(fā)明專利]一種基于深度學習的主題標簽推薦方法及工具在審
| 申請?zhí)枺?/td> | 201910587052.6 | 申請日: | 2019-07-01 |
| 公開(公告)號: | CN110297933A | 公開(公告)日: | 2019-10-01 |
| 發(fā)明(設(shè)計)人: | 張雨柔;李銳;于治樓;段強 | 申請(專利權(quán))人: | 山東浪潮人工智能研究院有限公司 |
| 主分類號: | G06F16/58 | 分類號: | G06F16/58;G06F16/78;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 馮春連 |
| 地址: | 250100 山東省濟南市高新*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 主題標簽 視頻片段 預測 特征提取 標注 圖像 社交媒體網(wǎng)絡 信息處理技術(shù) 支持向量機 語義 輸入圖像 特征分類 網(wǎng)絡模型 學習 嵌入 應用 | ||
本發(fā)明公開一種基于深度學習的主題標簽推薦方法,涉及信息處理技術(shù)領(lǐng)域,該方法基于zero?shot learning思想,利用深度網(wǎng)絡模型的特征提取能力對圖像或視頻片段進行特征提取,利用支持向量機SVM模型對提取的特征進行主題標簽的特征分類,并獲取關(guān)于圖像或視頻片段的一個預測主題標簽,利用結(jié)合詞嵌入模型word2vec和K近鄰算法對預測主題標簽進行擴展,進而得到與預測主題標簽語義相關(guān)的K個主題標簽,預測主題標簽和K個主題標簽作為輸入圖像或視頻片段的最終主題標簽進行標注,使得標注結(jié)果更為可靠。本發(fā)明還公開一種基于深度學習的主題標簽推薦工具,其余前述主題標簽推薦方法相結(jié)合,可應用到各大社交媒體網(wǎng)絡平臺上。
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理技術(shù)領(lǐng)域,具體的說是一種基于深度學習的主題標簽推薦方法及工具。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,目前市場上出現(xiàn)了各式各樣的自媒體社交應用軟件,例如微博、抖音、小紅書、西瓜視頻等,所有用戶都可以在App上上傳自己的視頻或圖像,同時為其標注合適的主題標簽,當我們所標注的主題標簽符合瀏覽者的興趣、主題標簽具備新穎性和吸引力、或者主題標簽符合目前網(wǎng)絡上的流行趨勢時,該媒體內(nèi)容將會受到更多的關(guān)注量。由于網(wǎng)絡上媒體信息內(nèi)容的多樣化以及媒體信息數(shù)據(jù)的海量化,為其標注適當?shù)闹黝}標簽仍然是一個亟待解決的問題。
傳統(tǒng)的方法有的直接使用單一的機器學習算法對圖像或視頻等媒體內(nèi)容直接進行主題標簽的預測,但這仍然無法滿足內(nèi)容稍微豐富或復雜的圖像或視頻主題標簽推薦問題。
目前,還有的方法所推薦的主題標簽類別比較固定,無法很好地適應當前的流行趨勢,導致所推薦的主題標簽不具備吸引力。
發(fā)明內(nèi)容
本發(fā)明針對目前技術(shù)發(fā)展的需求和不足之處,提供一種基于深度學習的主題標簽推薦方法及工具。
首先,本發(fā)明公開一種基于深度學習的主題標簽推薦方法,解決上述技術(shù)問題采用的技術(shù)方案如下:
一種基于深度學習的主題標簽推薦方法,該方法基于zero-shot learning思想,利用深度網(wǎng)絡模型的特征提取能力對圖像或視頻片段進行特征提取,利用支持向量機SVM模型對提取的特征進行主題標簽的特征分類,并獲取關(guān)于圖像或視頻片段的一個預測主題標簽,利用結(jié)合詞嵌入模型word2vec和K近鄰算法對預測主題標簽進行擴展,進而得到與預測主題標簽語義相關(guān)的K個主題標簽,預測主題標簽和K個主題標簽作為輸入圖像或視頻片段的最終主題標簽進行標注。
具體的,利用深度網(wǎng)絡模型的特征提取能力對圖像或視頻片段進行特征提取之前,需要對深度網(wǎng)絡模型的特征提取能力進行訓練,具體操作為:
收集具有標簽的圖像或視頻片段作為訓練集;
利用深度網(wǎng)絡模型對訓練集的圖像或視頻片段進行特征提??;
將深度網(wǎng)絡模型提取的特征作為圖像特征向量輸入支持向量機SVM模型;
支持向量機SVM模型對提取的特征進行主題標簽的特征分類,并獲取關(guān)于圖像或視頻片段的一個預測主題標簽;
結(jié)合詞嵌入模型word2vec和K近鄰算法對預測主題標簽進行擴展后獲得多個主題標簽;
判斷預測主題標簽與擴展后獲得的多個主題標簽是否相關(guān);
若相關(guān),則繼續(xù)訓練下一圖像或視頻片段;
若不相關(guān),則糾正后繼續(xù)訓練下一圖像或視頻片段。
具體的,所涉及訓練集被均分成三個數(shù)據(jù)集;
深度網(wǎng)絡模型有三個,分別為基于CNN卷積神經(jīng)網(wǎng)絡的圖像分類模型、基于RNN循環(huán)神經(jīng)網(wǎng)絡的圖像分類模型、基于DNN深度神經(jīng)網(wǎng)絡的圖像分類模型;
三個圖像分類模型對三個數(shù)據(jù)集的圖像或視頻片段分別進行特征提取;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東浪潮人工智能研究院有限公司,未經(jīng)山東浪潮人工智能研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910587052.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





