[發(fā)明專利]彈幕處理方法、設備和存儲介質有效
| 申請?zhí)枺?/td> | 202011586426.1 | 申請日: | 2020-12-28 |
| 公開(公告)號: | CN112672202B | 公開(公告)日: | 2023-03-24 |
| 發(fā)明(設計)人: | 蔣濤;陳健生 | 申請(專利權)人: | 廣州博冠信息科技有限公司 |
| 主分類號: | H04N21/435 | 分類號: | H04N21/435;H04N21/488;H04N21/4788;G06V10/762;G06V10/82;G06N3/0442;G06N3/08 |
| 代理公司: | 北京同立鈞成知識產(chǎn)權代理有限公司 11205 | 代理人: | 朱穎;臧建明 |
| 地址: | 510663 廣東省廣州市天*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 彈幕 處理 方法 設備 存儲 介質 | ||
本申請實施例提供一種彈幕處理方法、設備和存儲介質,獲取目標時間段內(nèi)多個子時間段產(chǎn)生的多條彈幕的句向量;將同一子時間段的多條彈幕聚類為至少一個彈幕類,獲得彈幕類中的聚類中心彈幕;根據(jù)同一子時間段的至少一個彈幕類的聚類中心彈幕的句向量,將多個不同子時間段的彈幕類的聚類中心彈幕聚類為N個二級彈幕類,獲得每個二級彈幕類的聚類中心彈幕;確定每個二級彈幕類的聚類中心彈幕為目標時間段產(chǎn)生的熱詞彈幕。由于根據(jù)彈幕的句向量實現(xiàn)對彈幕的語義理解,再利用聚類算法對彈幕進行聚類,無需對彈幕進行分詞,也無需統(tǒng)計分析彈幕中的特征信息,可以在提升熱詞彈幕準確性的同時,簡化熱詞彈幕獲取過程,提升熱詞彈幕的獲得效率。
技術領域
本申請實施例涉及互聯(lián)網(wǎng)技術領域,尤其涉及一種彈幕處理方法、設備和存儲介質。
背景技術
隨著互聯(lián)網(wǎng)技術的發(fā)展,彈幕作為一種互動方法,其簡潔有趣的信息交流方式而被廣泛應用,例如視頻播放、網(wǎng)絡直播等均可以使用彈幕進行交互,以增加視頻觀看過程中的趣味性。在此過程中,服務器會提供一些熱詞供用戶選取并發(fā)送,然后根據(jù)用戶選取的熱詞以彈幕的形式在視頻畫面中對該文字信息進行顯示。
現(xiàn)有技術中,主要通過對視頻中的彈幕進行統(tǒng)計,根據(jù)出現(xiàn)次數(shù)、出現(xiàn)頻率等信息對彈幕進行重要程度排序,再根據(jù)重要程度提供熱詞供用戶選用,然而,上述提供熱詞彈幕的方法較為繁瑣,且提供的熱詞彈幕不夠準確。
發(fā)明內(nèi)容
本申請實施例提供一種彈幕處理方法、設備和存儲介質,用于解決現(xiàn)有技術中,提供熱詞彈幕的方法較為繁瑣,且提供的熱詞彈幕不夠準確的技術問題。
第一方面,本申請實施例提供一種彈幕處理方法,包括:
獲取目標子時間段內(nèi)多個不同子時間段產(chǎn)生的多條彈幕,并獲取多條彈幕的句向量;
根據(jù)同一子時間段的彈幕的句向量,將同一子時間段的多條彈幕聚類為至少一個彈幕類,根據(jù)每個彈幕類中各條彈幕的句向量,獲得每個彈幕類中的聚類中心彈幕;
根據(jù)同一子時間段的至少一個彈幕類的聚類中心彈幕的句向量,將多個不同子時間段的各個彈幕類的聚類中心彈幕聚類為N個二級彈幕類,根據(jù)二級彈幕類中包含的彈幕的句向量,獲得二級彈幕類的聚類中心彈幕;
確定二級彈幕類的聚類中心彈幕為目標時間段產(chǎn)生的熱詞彈幕,熱詞彈幕用于供用戶快捷輸入彈幕。
可選的,獲取多條彈幕的句向量,包括:
針對每條彈幕,獲取彈幕中每個字的字向量;
根據(jù)彈幕中各字的字向量,獲取彈幕的字向量均值;
根據(jù)字向量均值,獲得彈幕的句向量。
可選的,獲取目標時間段內(nèi)多個不同子時間段產(chǎn)生的多條彈幕,并獲取多條彈幕的句向量,包括:
針對每條彈幕,將彈幕輸入至預先訓練好的bert模型,獲得bert模型輸出的彈幕中每個字的字向量;
將彈幕中各字的字向量輸入至預先訓練好的雙向LSTM網(wǎng)絡,獲取LSTM網(wǎng)絡輸出的彈幕的字向量均值。
可選的,根據(jù)同一子時間段的彈幕的句向量,將同一子時間段的多條彈幕聚類為至少一個彈幕類,包括:
針對同一子時間段,將子時間段的多條彈幕的句向量進行降維和歸一化處理;
根據(jù)同一子時間段處理后的多條彈幕的句向量,將同一子時間段的多條彈幕聚類為至少一個彈幕類。
可選的,根據(jù)同一子時間段的每條彈幕的句向量,將同一子時間段的多條彈幕聚類為至少一個彈幕類,包括:
針對同一子時間段,根據(jù)子時間段任意兩條彈幕的句向量,獲得任意兩條彈幕的句向量間的余弦距離;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州博冠信息科技有限公司,未經(jīng)廣州博冠信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011586426.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種用于車輛輪胎輪轂裝配輔助設備
- 下一篇:輸送裝置及其施工方法
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務器,例如:VOD服務器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設備,如STB[機頂盒];相關操作
H04N21-60 .用于在服務器和客戶端之間或者在遠程客戶端之間的視頻分配的網(wǎng)絡結構或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨立于分配過程實現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件





