[發明專利]一種視頻分類方法、裝置及電子設備在審
| 申請號: | 201610375160.3 | 申請日: | 2016-05-31 |
| 公開(公告)號: | CN107451148A | 公開(公告)日: | 2017-12-08 |
| 發明(設計)人: | 劉德順 | 申請(專利權)人: | 北京金山安全軟件有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市廣友專利事務所有限責任公司11237 | 代理人: | 祁獻民 |
| 地址: | 100085 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 分類 方法 裝置 電子設備 | ||
技術領域
本發明涉及信息分類技術,尤其涉及一種視頻分類方法、裝置及電子設備。
背景技術
當今社會,信息已經滲透到每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來,其中,對海量信息的準確分類,有利于人們減少瀏覽海量信息所需的時間,能夠獲取相關行業更為精確的信息,從而依據精確的信息提升決策的準確以及瀏覽信息的體驗。
由于互聯網上包含有眾多視頻網站,而每一視頻網站包含有眾多視頻,為了便于用戶從視頻網站獲取質量較高的視頻,需要每一視頻網站對其中的視頻進行分類排名。目前的視頻分類方法,主要是通過用戶自動為視頻進行標簽分類并上傳到視頻網站,視頻網站的運營人員依據視頻標簽并結合視頻內容重新為視頻進行分類,例如,對于用戶上傳包含視頻標簽為喜劇、娛樂、幽默的視頻,運營人員經過再次分析后,可以將其歸類于搞笑視頻或非搞笑視頻。在分類后,再結合該視頻的熱度以及推薦進行排名,并按照排名順序在網站上進行推薦,例如,將一些分類下排名靠前的視頻推薦至視頻網站的首頁,以便獲得更多人們的關注,有利于首頁視頻的推廣。
但現有的視頻分類方法,由于視頻網站基于運營人員的人工方式對視頻進行分類,需要耗費大量的人力來進行視頻篩選和分類,使得視頻分類效率較低。進一步地,由于各視頻網站的運營人員對視頻分類時,依據主觀判斷分類,使得視頻分類方法千差萬別,不同的視頻依據不同的運營人員,可能被分類到不同的分類,導致每一分類視頻可能包括所有視頻,使得視頻分類較為混亂,從而影響用戶的視頻體驗。
發明內容
有鑒于此,本發明實施例提供一種視頻分類方法、裝置及電子設備,能夠提升視頻分類效率,解決現有視頻分類方法需要人工進行分類導致的視頻分類效率較低的問題。
第一方面,本發明實施例提供一種視頻分類方法,包括:
獲取待分類視頻;
提取所述待分類視頻中的關鍵詞,得到關鍵詞組;
將所述關鍵詞組依次與預先設置的各視頻分類映射的分類關鍵詞集進行匹配,分別得到與各分類關鍵詞集相匹配的分類關鍵詞組;
獲取所述待分類視頻的瀏覽參數,依據所述瀏覽參數以及所述分類關鍵詞組計算所述待分類視頻的分類質量分數;
如果所述分類質量分數超過預先設置的分類質量分數閾值,將所述待分類視頻歸類于所述分類關鍵詞組對應的分類視頻。
結合第一方面,在第一方面的第一種實施方式中,將所述關鍵詞組依次與預先設置的各視頻分類映射的分類關鍵詞集進行匹配,分別得到與各分類關鍵詞集相匹配的分類關鍵詞組包括:
在視頻分類與分類關鍵詞集的映射關系集中,提取第一分類關鍵詞集;
將所述關鍵詞組與所述第一分類關鍵詞集進行匹配,獲取所述關鍵詞組中與所述第一分類關鍵詞集相匹配的各關鍵詞,得到第一分類關鍵詞組;
判斷所述映射關系集中的分類關鍵詞集是否提取完畢,如果是,結束流程,如果否,提取下一第二分類關鍵詞集,將所述關鍵詞組與所述第二分類關鍵詞集進行匹配,獲取所述關鍵詞組中與所述第二分類關鍵詞集相匹配的各關鍵詞,得到第二分類關鍵詞組,直至所述映射關系集中的分類關鍵詞集被提取完畢。
結合第一方面的第一種實施方式,在第一方面的第二種實施方式中,所述獲取視頻分類與分類關鍵詞集的映射關系集包括:
獲取樣本視頻集;
按照預先設置的視頻分類,對所述樣本視頻集中的每一樣本視頻進行分類,得到每一視頻分類對應的分類樣本視頻組;
提取一分類樣本視頻組中每一分類樣本視頻包含的關鍵詞,得到樣本關鍵詞組;
對所述樣本關鍵詞組中的關鍵詞進行詞頻統計;
將詞頻前N位的關鍵詞寫入所述分類樣本視頻組映射的分類關鍵詞集,構建視頻分類與所述分類關鍵詞集的映射關系;
判斷分類樣本視頻組是否提取完畢,如果否,執行所述提取一分類樣本視頻組中每一分類樣本視頻包含的關鍵詞的步驟,如果是,依據構建的映射關系形成映射關系集。
結合第一方面、第一方面的第一種或第二種實施方式,在第一方面的第三種實施方式中,利用下式計算所述分類質量分數:
F=ξ1*lg(brows)+ξ2*lg10((likes-dislikes)*(likes/(dislikes+1)))+ξ3*lg(date)+ξ4*key-words
式中,
F為分類質量分數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山安全軟件有限公司,未經北京金山安全軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610375160.3/2.html,轉載請聲明來源鉆瓜專利網。





