[發明專利]一種彈幕篩選方法及裝置在審
| 申請號: | 201810769274.5 | 申請日: | 2018-07-13 |
| 公開(公告)號: | CN109040852A | 公開(公告)日: | 2018-12-18 |
| 發明(設計)人: | 都金濤 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | H04N21/488 | 分類號: | H04N21/488;G06F17/27 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 楊華;王寶筠 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 篩選 排序結果 隨機選擇 預設條件 排序 刪除 申請 | ||
1.一種彈幕篩選方法,其特征在于,包括:
提取彈幕的特征,所述特征包括用戶交互類特征、正向情感程度、語義含量特征和新鮮度、精彩度中的至少一項;所述用戶交互類特征用于表征所述彈幕對用戶交互程度的貢獻,所述正向情感程度用于表征所述彈幕的表達的正向情感的程度,所述語義含量特征用于表征所述彈幕中有效內容的比重,所述新鮮度用于表征所述彈幕的發表時間距離當前時間的時長,所述精彩度用于表征所述彈幕評價的視頻的精彩程度;
使用所述彈幕的特征,對所述彈幕進行排序,得到排序結果;
刪除所述排序結果中不滿足預設條件的彈幕,得到篩選后的彈幕。
2.根據權利要求1所述的方法,其特征在于,所述用戶交互類特征包括:
角色彈幕程度,任意一條彈幕的所述角色彈幕程度為:分子與分母的比值,所述分母為N條彈幕中角色彈幕的總數量,該條彈幕為角色彈幕的情況下,所述分子為第一數值,否則,所述分子為第二數值,所述第一數值大于所述第二數值。
3.根據權利要求1或2所述的方法,其特征在于,所述用戶交互類特征還包括:
點贊程度,任意一條彈幕的所述點贊程度為:該條彈幕獲得的點贊個數與N條彈幕中每條彈幕獲得的點贊個數之和的比值。
4.根據權利要求1所述的方法,其特征在于,所述正向情感程度包括:
正向觀點詞含量,任意一條彈幕的所述正向觀點詞含量依據該條彈幕中包括的預設的正向觀點詞和預設的負向觀點詞的數量之差確定。
5.根據權利要求4所述的方法,其特征在于,所述任意一條彈幕的所述正向觀點詞含量依據該條彈幕中包括的正向觀點詞和負向觀點詞的數量之差確定包括:
所述任意一條彈幕的所述正向觀點詞含量為:
6.根據權利要求1所述的方法,其特征在于,所述語義含量特征包括以下至少一項:
文本長度占比、中文字符占比、名詞占比、動詞占比;
任意一條彈幕的所述文本長度占比為:該條彈幕中包含的字符的個數與N條彈幕包含的字符個數之和的比值;任意一條彈幕的所述中文字符占比為:該條彈幕中包含的中文字符的個數與該條彈幕包含的所有字符的個數之和的比值;任意一條彈幕的所述名詞占比為:該條彈幕中包含的名詞的個數與該條彈幕中包含的所有分詞的個數之和的比值;任意一條彈幕的所述名詞占比為:該條彈幕中包含的動詞的個數與該條彈幕中包含的所有分詞的個數之和的比值。
7.根據權利要求1所述的方法,其特征在于,任意一條彈幕的所述新鮮度依據該條彈幕發表的過期天數與N條彈幕中的每條彈幕的過期天數之和的比值確定,所述過期天數為彈幕的發表日距離當日的天數。
8.根據權利要求7所述的方法,其特征在于,任意一條彈幕的所述新鮮度為:
9.根據權利要求1所述的方法,其特征在于,所述精彩度包括:
彈幕評價的劇情的精彩程度,所述劇情的精彩程度為:第i秒的彈幕量與預設時間范圍內的彈幕量的比值,所述預設時間范圍包括所述第i秒。
10.根據權利要求1、2、4、6、7、8或9所述的方法,其特征在于,所述預設條件包括彈幕長度滿足預設長度、中文字符占比滿足預設的占比、不與其它彈幕重復中的至少一項;
所述刪除所述彈幕序列中不滿足預設條件的彈幕,得到篩選后的彈幕包括:
從所述排序結果中刪除不滿足第一預設條件的彈幕,得到第一篩選結果,所述第一預設條件包括:彈幕長度滿足預設長度、中文字符占比滿足預設的占比中的至少一項;
刪除所述第一篩選結果中的重復彈幕,得到第二篩選結果,所述重復彈幕為相似度大于預設的相似度閾值的兩條彈幕中的一條彈幕。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810769274.5/1.html,轉載請聲明來源鉆瓜專利網。





