[發(fā)明專(zhuān)利]多媒體資源的標(biāo)簽信息生成方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201810400431.5 | 申請(qǐng)日: | 2018-04-28 |
| 公開(kāi)(公告)號(hào): | CN108595660A | 公開(kāi)(公告)日: | 2018-09-28 |
| 發(fā)明(設(shè)計(jì))人: | 王聰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G06F17/30 | 分類(lèi)號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 劉映東 |
| 地址: | 518057 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 標(biāo)簽信息 多媒體資源 詞匯分類(lèi) 目標(biāo)多媒體 詞匯 存儲(chǔ)介質(zhì) 關(guān)鍵詞匯 評(píng)論信息 主題信息 詞向量 分詞 互聯(lián)網(wǎng)技術(shù) 分詞處理 獲取目標(biāo) 資源生成 精準(zhǔn)度 智能性 聚類(lèi) 自動(dòng)化 消耗 | ||
本發(fā)明公開(kāi)了一種多媒體資源的標(biāo)簽信息生成方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備,屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域。所述方法包括:獲取目標(biāo)多媒體資源的評(píng)論信息,對(duì)所述評(píng)論信息進(jìn)行分詞處理;獲取分詞后得到的至少一個(gè)詞匯的詞向量;對(duì)所述至少一個(gè)詞匯的詞向量進(jìn)行聚類(lèi),得到多個(gè)詞匯分類(lèi),不同的詞匯分類(lèi)具有不同的主題信息;在分詞后得到的至少一個(gè)詞匯中,提取所述目標(biāo)多媒體資源的關(guān)鍵詞匯;基于所述關(guān)鍵詞匯和所述多個(gè)詞匯分類(lèi)的主題信息,為所述目標(biāo)多媒體資源生成標(biāo)簽信息。本發(fā)明在生成標(biāo)簽信息時(shí)實(shí)現(xiàn)了完全自動(dòng)化,無(wú)需消耗大量的人力和時(shí)間,智能性較佳;且,生成的標(biāo)簽信息更為精確,提升了后續(xù)在進(jìn)行多媒體資源推薦時(shí)的精準(zhǔn)度。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種多媒體資源的標(biāo)簽信息生成方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,時(shí)下各大網(wǎng)站均致力于如何高效且精準(zhǔn)地向用戶(hù)進(jìn)行多媒體資源推薦,以提升用戶(hù)體驗(yàn)。其中,上述提及的多媒體資源可涵蓋影片、電視劇、小說(shuō)、文章等等。通常情況下,在進(jìn)行多媒體資源推薦之前,一般還需先為多媒體資源生成相應(yīng)的標(biāo)簽信息,進(jìn)而通過(guò)標(biāo)簽信息來(lái)完成多媒體資源推薦。其中,標(biāo)簽信息用于對(duì)多媒體資源進(jìn)行標(biāo)識(shí),以便于用戶(hù)甄別多媒體資源的題材類(lèi)型或核心主題等。
基于以上敘述可知,多媒體資源的標(biāo)簽信息對(duì)進(jìn)行多媒體資源推薦十分重要,為此,如何為多媒體資源生成標(biāo)簽信息成為了時(shí)下本領(lǐng)域技術(shù)人員關(guān)注的一個(gè)焦點(diǎn)。其中,相關(guān)技術(shù)在為多媒體資源生成標(biāo)簽信息時(shí)完全依賴(lài)人工完成。以多媒體資源為影片為例,則參見(jiàn)圖1A,若影片為“肖申克的救贖”,那么工作人員可能會(huì)人工為其添加“劇情”、“犯罪”這樣的標(biāo)簽信息。
在實(shí)現(xiàn)本發(fā)明的過(guò)程中,相關(guān)技術(shù)至少存在以下問(wèn)題:
標(biāo)簽信息依賴(lài)于人工生成,而多媒體資源的數(shù)目海量,所以該種標(biāo)簽信息的生成方式會(huì)消耗大量的人力和時(shí)間,不夠智能化;此外,人工生成的標(biāo)簽信息存在精確性較差的缺陷,這會(huì)導(dǎo)致后續(xù)在基于標(biāo)簽信息進(jìn)行多媒體資源推薦時(shí)精準(zhǔn)度大大降低。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種多媒體資源的標(biāo)簽信息生成方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備,解決了相關(guān)技術(shù)存在的生成標(biāo)簽信息時(shí)不夠智能化以及精確性較差,從而導(dǎo)致在推薦多媒體資源時(shí)推薦精準(zhǔn)度也大大下降的問(wèn)題。所述技術(shù)方案如下:
一方面,提供了一種多媒體資源的標(biāo)簽信息生成方法,所述方法包括:
獲取目標(biāo)多媒體資源的評(píng)論信息,對(duì)所述評(píng)論信息進(jìn)行分詞處理;
獲取分詞后得到的至少一個(gè)詞匯的詞向量;
對(duì)所述至少一個(gè)詞匯的詞向量進(jìn)行聚類(lèi),得到多個(gè)詞匯分類(lèi),不同的所述詞匯分類(lèi)具有不同的主題信息;
在分詞后得到的至少一個(gè)詞匯中,提取所述目標(biāo)多媒體資源的關(guān)鍵詞匯;
基于所述關(guān)鍵詞匯和所述多個(gè)詞匯分類(lèi)的主題信息,為所述目標(biāo)多媒體資源生成標(biāo)簽信息。
另一方面,提供了一種多媒體資源的標(biāo)簽信息生成裝置,所述裝置包括:
第一獲取模塊,用于獲取目標(biāo)多媒體資源的評(píng)論信息,對(duì)所述評(píng)論信息進(jìn)行分詞處理;
第二獲取模塊,用于獲取分詞后得到的至少一個(gè)詞匯的詞向量;
聚類(lèi)模塊,用于對(duì)所述至少一個(gè)詞匯的詞向量進(jìn)行聚類(lèi),得到多個(gè)詞匯分類(lèi),不同的所述詞匯分類(lèi)具有不同的主題信息;
提取模塊,用于在分詞后得到的至少一個(gè)詞匯中,提取所述目標(biāo)多媒體資源的關(guān)鍵詞匯;
生成模塊,用于基于所述關(guān)鍵詞匯和所述多個(gè)詞匯分類(lèi)的主題信息,為所述目標(biāo)多媒體資源生成標(biāo)簽信息。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810400431.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)監(jiān)控系統(tǒng)
- 搜索結(jié)果的導(dǎo)航方法及裝置
- 標(biāo)簽打印機(jī)及其控制方法
- 用于信息定向更新的方法、NFC標(biāo)簽和系統(tǒng)
- 基于標(biāo)簽的信息分發(fā)和評(píng)價(jià)系統(tǒng)
- 一種標(biāo)簽展示方法及標(biāo)簽系統(tǒng)
- 一種基于標(biāo)簽的信息管理系統(tǒng)、方法、存儲(chǔ)器及電子設(shè)備
- 針對(duì)用戶(hù)的物品信息推送方法、裝置、電子設(shè)備和介質(zhì)
- 原物料信息標(biāo)簽讀取機(jī)臺(tái)
- 詞匯分類(lèi)選擇輸入法
- 管理針對(duì)異構(gòu)資源域的分類(lèi)系統(tǒng)的技術(shù)
- 詞匯分類(lèi)系統(tǒng)及其方法
- 相關(guān)詞匯的查詢(xún)系統(tǒng)及其查詢(xún)方法
- 一種文本分類(lèi)方法和裝置
- 一種詞匯分類(lèi)的方法、系統(tǒng)和實(shí)現(xiàn)方法
- 一種敏感數(shù)據(jù)自動(dòng)識(shí)別與分類(lèi)的方法
- 一種文本分類(lèi)方法以及裝置
- 一種詞庫(kù)建立方法、信息檢索方法及對(duì)應(yīng)的系統(tǒng)
- 一種多次迭代對(duì)折詞匯層級(jí)分類(lèi)方法及系統(tǒng)
- 提供統(tǒng)計(jì)圖形的多媒體傳播系統(tǒng)和相關(guān)的方法和控制裝置
- 一種多媒體文件處理方法、相關(guān)設(shè)備及系統(tǒng)
- 一種多媒體信息分享的方法、相關(guān)裝置及系統(tǒng)
- 一種多媒體物料的處理方法、裝置及多媒體播放設(shè)備
- 一種多媒體推送計(jì)劃的創(chuàng)建方法和創(chuàng)建系統(tǒng)
- 一種多媒體播放方法、裝置及存儲(chǔ)介質(zhì)
- 多媒體信息的播放控制方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種多媒體物料的處理方法、裝置及多媒體播放設(shè)備
- 多媒體資源推薦方法、裝置及存儲(chǔ)介質(zhì)
- 基于區(qū)塊鏈的多媒體處理方法及相關(guān)設(shè)備





