[發明專利]提取熱詞的方法、系統、電子設備及介質有效
| 申請號: | 202010865409.5 | 申請日: | 2020-08-25 |
| 公開(公告)號: | CN112069950B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 鄭翔;宗博文;徐文銘 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06F16/951;G06F16/783;G06F16/78;G10L15/22 |
| 代理公司: | 北京遠智匯知識產權代理有限公司 11659 | 代理人: | 范坤坤 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 提取 方法 系統 電子設備 介質 | ||
本公開公開了一種提取熱詞的方法、裝置、電子設備及存儲介質,該方法包括:確定目標視頻幀中的目標標識,并獲取與所述目標標識相對應的目標頁面;通過對所述目標頁面解析處理,得到與所述目標頁面相對應的目標內容;基于所述目標內容,確定所述目標視頻幀所屬目標視頻的至少一個熱詞詞匯。本公開實施例的技術方案,通過爬取與目標標識相對應的目標頁面,并基于目標頁面中的頁面內容,快速準確的確定目標視頻幀所屬視頻的熱詞,以便在語音轉文字處理時,獲取與語音信息對應的熱詞,從而提高語音轉文字的準確率的技術效果。
技術領域
本公開實施例涉及計算機技術領域,尤其涉及一種提取熱詞的方法、系統、電子設備及介質。
背景技術
隨著互聯網通信技術的發展,越來越多的用戶傾向于線上溝通或者交流。
在基于線上溝通時,可能存在無法根據視頻幀中顯示的內容了解其所屬視頻的核心思想,引起無法很好的了解視頻的內容,導致存在交互效率極低以及用戶體驗較差的技術問題。
發明內容
本公開提供一種提取熱詞的方法、系統、電子設備及介質,以實現通過對各個目標視頻幀進行處理,提高確定目標視頻幀所屬視頻的熱詞詞匯效率的技術效果。
第一方面,本公開實施例提供了一種提取熱詞的方法,該方法包括:
確定目標視頻幀中的目標標識,并獲取與所述目標標識相對應的目標頁面;
通過對所述目標頁面解析處理,得到所述目標頁面中的目標內容;
基于所述目標內容,確定所述目標視頻幀所屬目標視頻的至少一個熱詞詞匯。
第二方面,本公開實施例還提供了一種提取熱詞的裝置,該裝置包括:
目標頁面獲取模塊,用于確定目標視頻幀中的目標標識,并獲取與所述目標標識相對應的目標頁面;
目標內容確定模塊,用于通過對所述目標頁面解析處理,得到與所述目標頁面中的目標內容;
熱詞詞匯確定模塊,用于基于所述目標內容,確定所述目標視頻幀所屬目標視頻的至少一個熱詞詞匯。
第三方面,本公開實施例還提供了一種提取熱詞的系統,該系統包括:
圖文識別子系統確定目標視頻幀中的目標標識,并將所述目標標識發送至爬蟲子系統;
所述爬蟲子系統接收所述目標標識,并獲取與所述目標標識相對應的目標頁面,將所述目標頁面發送至頁面解析子系統;
所述頁面解析子系統接收所述目標頁面,并對所述目標頁面解析處理,得到所述目標頁面中的目標內容,將所述目標內容發送至熱詞提取子系統;
所述熱詞提取子系統接收所述目標內容,并確定所述目標視頻幀所屬目標視頻的至少一個熱詞詞匯。
第四方面,本公開實施例還提供了一種電子設備,所述電子設備包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如本公開實施例任一所述的提取熱詞的方法。
第五方面,本公開實施例還提供了一種包含計算機可執行指令的存儲介質,所述計算機可執行指令在由計算機處理器執行時用于執行如本公開實施例任一所述的提取熱詞的方法。
本公開實施例的技術方案,通過對目標視頻的各個目標視頻幀進行處理,可以確定目標視頻幀所屬目標視頻的熱詞詞匯,以在語音轉文字處理過程中,基于確定的熱詞詞匯確定語音信息相對應的文字,提高了語音轉文字的準確性,從而在基于轉換的文字進行交互時,提高了用戶交互效率的技術效果。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010865409.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種高速公路車輛唯一標識特征提取方法及系統
- 下一篇:一種車輛連接結構及車輛





