[發明專利]視頻場景的實體識別方法、裝置、電子設備和介質在審
| 申請號: | 201910829539.0 | 申請日: | 2019-09-03 |
| 公開(公告)號: | CN110516654A | 公開(公告)日: | 2019-11-29 |
| 發明(設計)人: | 王述;任可欣;馮知凡;張揚;朱勇 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06F17/27;G06F16/35 |
| 代理公司: | 11332 北京品源專利代理有限公司 | 代理人: | 孟金喆<國際申請>=<國際公布>=<進入 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 實體識別 目標實體 目標視頻 算法 目標領域 文本特征 人工智能領域 電子設備 視頻場景 視頻文本 通用性強 業務需求 預先設置 調用 申請 視頻 | ||
1.一種視頻場景的實體識別的方法,其特征在于,包括:
確定待處理的目標視頻的文本特征;
確定所述目標視頻所屬的目標領域;
根據所述目標領域確定目標實體識別算法,并調用所述目標實體識別算法對所述文本特征進行實體識別,以得到所述目標視頻中包括的目標實體。
2.根據權利要求1所述的方法,其特征在于,根據所述目標領域確定目標實體識別算法,并調用所述目標實體識別算法對所述文本特征進行實體識別,包括:
若所述目標領域屬于候選領域集合,則將知識重要度實體識別算法作為目標實體識別算法;
確定所述文本特征中包括的候選實體;
根據所述知識重要度實體識別算法中候選領域與候選實體類別之間的映射關系,確定目標領域關聯的目標實體類別;
將屬于所述目標實體類別的候選實體作為所述目標視頻中的目標實體。
3.根據權利要求2所述的方法,其特征在于,所述候選領域集合中包括如下至少一項候選領域:影視領域、娛樂領域、動漫領域、游戲領域、音樂領域、汽車領域、舞蹈領域、美食領域、體育領域和大自然領域;
相應地,候選領域與候選實體類別之間的映射關系包括如下至少一項:
影視領域關聯的如下至少一種實體類別:影視劇名、主要角色和主要演員;
娛樂領域關聯的如下至少一種實體類別:綜藝節目名稱、嘉賓、主持人和涉及的娛樂人物;
動漫領域關聯有如下至少一種實體類別:動漫名稱和主要角色;
游戲領域關聯有如下至少一種實體類別:游戲名稱、主要角色和玩家;
音樂領域關聯有如下至少一種實體類別:音樂名稱和歌手;
汽車領域關聯有如下至少一種實體類別:汽車品牌、車型和汽車名稱;
舞蹈領域關聯有如下至少一種實體類別:舞蹈名稱和舞蹈演員;
美食領域關聯有如下至少一種實體類別:美食名稱;
體育領域關聯有如下至少一種實體類別:體育項目、運動員和運動隊名;
大自然領域關聯有如下至少一種實體類別:動物、植物、山川和河流。
4.根據權利要求1所述的方法,其特征在于,確定所述目標視頻所屬的目標領域,包括:
將所述目標視頻的圖像數據作為視頻領域分類算法的輸入,以得到所述目標視頻所屬的目標領域。
5.根據權利要求1所述的方法,其特征在于,根據所述目標領域確定目標實體識別算法,并調用所述目標實體識別算法對所述文本特征進行實體識別,還包括:
若所述目標領域不屬于候選領域集合,則調用至少一種通用實體識別算法對所述文本特征進行實體識別;
其中,所述通用實體識別算法包括如下至少一項:采用Skip-Gram構建的無監督實體識別算法、基于xgboost分類的實體算法、基于word2vec的實體算法、textrank圖游走算法、基于term重要度的wordrank算法、基于tf-idf的排序算法,以及基于BiLSTM-CRF序列標注的算法。
6.根據權利要求1所述的方法,其特征在于,對所述文本特征進行實體識別之前,還包括:
調用文本質量模型確定所述文本特征的文本質量;
根據確定結果,對所述文本特征進行篩選。
7.根據權利要求1所述的方法,其特征在于,確定待處理的目標視頻的文本特征,包括:
提取目標視頻的標題以及描述文本,作為第一類來源文本;
對待處理的目標視頻中圖像進行OCR識別,得到目標視頻的字幕信息,作為第二類來源文本;
對目標視頻的音頻信息進行ASR識別;將ASR識別結果和/或作者標簽文本,作為第三類來源文本。
8.根據權利要求1所述的方法,其特征在于,對所述文本特征進行實體識別之后,還包括:
根據實體的文本來源信息,調整實體的置信度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910829539.0/1.html,轉載請聲明來源鉆瓜專利網。





