[發明專利]基于人工智能的圖文內容質量識別方法和裝置在審
| 申請號: | 202011222592.3 | 申請日: | 2020-11-05 |
| 公開(公告)號: | CN113407663A | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 朱靈子;衡陣;馬連洋 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/211;G06F40/186;G06N3/04 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 毛丹 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人工智能 圖文 內容 質量 識別 方法 裝置 | ||
1.一種基于人工智能的圖文內容質量識別方法,其特征在于,所述方法包括:
獲取待識別文章,并提取所述待識別文章的文章先驗特征、文本內容和圖文序列特征;
對各所述文章先驗特征進行特征交叉處理,得到交叉先驗特征向量;
根據所述文本內容生成所述待識別文章的文檔特征向量;
對各所述圖文序列特征進行加權處理,得到加權處理后的圖文序列特征向量;
將所述交叉先驗特征向量、所述文檔特征向量和加權處理后的所述圖文序列特征向量進行全連接處理,得到所述待識別文章的綜合特征向量;
基于所述綜合特征向量確定所述待識別文章的圖文內容質量。
2.根據權利要求1所述的方法,其特征在于,所述對各所述文章先驗特征進行特征交叉處理,得到交叉先驗特征向量,包括:
根據各所述文章先驗特征,分別構建稀疏特征嵌入層和稠密特征嵌入層;
基于所述稀疏特征嵌入層和所述稠密特征嵌入層,對各所述文章先驗特征進行特征交叉處理,生成交叉先驗特征向量。
3.根據權利要求1所述的方法,其特征在于,所述對各所述圖文序列特征進行加權處理,得到加權處理后的圖文序列特征向量,包括:
根據訓練好的雙向記憶網絡模型,生成與各所述圖文序列特征對應的圖文序列特征向量;所述圖文序列特征根據訓練好的排版結構模型生成;
根據加權機制對各所述圖文序列特征向量進行加權處理,生成加權處理后的圖文序列特征向量。
4.根據權利要求1所述的方法,其特征在于,所述根據所述文本內容生成所述待識別文章的文檔特征向量,包括:
根據訓練好的多層注意力模型,確定與所述文本內容對應的層次結構;
基于所述層次結構和訓練好的語言表征模型,生成與所述文本內容對應的文檔特征向量。
5.根據權利要求1至3任意一項所述的方法,其特征在于,所述基于所述綜合特征向量確定所述待識別文章的圖文內容質量,包括:
根據訓練好的質量評估集成模型,計算得到所述綜合特征向量的質量數據;
根據所述質量數據確定所述待識別文章的圖文內容質量。
6.根據權利要求4所述的方法,其特征在于,所述基于所述層次結構和訓練好的語言表征模型,生成與所述文本內容對應的文檔特征向量,包括:
基于所述層次結構和訓練好的語言表征模型,生成與各詞向量對應的第一隱向量;
根據所述詞向量和對應的所述第一隱向量,確定與各所述詞向量對應的第一貢獻重要度權重;
根據所述第一貢獻重要度權重對所述詞向量進行加權處理,生成與所述待識別文章對應的句子向量;
基于所述層次結構和訓練好的語言表征模型,生成與所述句子向量對應的第二隱向量;
根據所述句子向量和所述第二隱向量,確定與各所述句子向量對應的第二貢獻重要度權重;
根據所述第二貢獻重要度權重對所述句子向量進行加權處理,生成與所述待識別文章對應的文檔特征向量。
7.根據權利要求5所述的方法,其特征在于,在所述根據所述質量數據確定所述待識別文章的圖文內容質量,還包括:
根據所述圖文內容質量確定對應的加權處理方式;
根據所述加權處理方式,對相應圖文內容進行層次化加權處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011222592.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于時效的數據處理方法、裝置、電子設備及存儲介質
- 下一篇:電子裝置
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





