[發(fā)明專利]圖文內(nèi)容處理方法及介質(zhì)有效
| 申請?zhí)枺?/td> | 202011042702.8 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112132075B | 公開(公告)日: | 2022-07-08 |
| 發(fā)明(設(shè)計)人: | 朱靈子;衡陣;馬連洋 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V30/41 | 分類號: | G06V30/41;G06V30/19;G06V10/82;G06F16/957;G06F40/30;G06N3/08;G06N3/04;G06N5/00 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 李娟 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖文 內(nèi)容 處理 方法 介質(zhì) | ||
1.一種圖文內(nèi)容處理方法,其特征在于,包括:
獲取待處理圖文內(nèi)容;所述待處理圖文內(nèi)容包括目標文本信息和目標圖片;
根據(jù)所述目標文本信息和所述目標圖片的目標形式特征,獲得所述待處理圖文內(nèi)容在形式上的先驗體驗評估結(jié)果,其中,具體包括:將所述目標形式特征輸入梯度提升決策樹模型,其中,所述梯度提升決策樹模型包括按照層級關(guān)系構(gòu)建的多個學習器,每個學習器為一個節(jié)點,通過所述梯度提升決策樹模型的根節(jié)點,對所述目標形式特征進行第一次學習,得到第一學習結(jié)果,將所述第一學習結(jié)果輸入到所述根節(jié)點的下一級葉子節(jié)點,以所述下一級葉子節(jié)點作為新的根節(jié)點繼續(xù)進行學習,直到所述下一級葉子節(jié)點為最小葉子節(jié)點,獲得所述最小葉子節(jié)點的學習結(jié)果,以及根據(jù)所述最小葉子節(jié)點的學習結(jié)果,獲得先驗體驗評估結(jié)果;
根據(jù)所述目標文本信息,獲得所述待處理圖文內(nèi)容在內(nèi)容上的內(nèi)容質(zhì)量評估結(jié)果,其中,具體包括:通過內(nèi)容質(zhì)量模型中編碼器的各個編碼單元,按照目標文本序列的輸入順序,并應用注意力機制,生成每個輸入位置對應的編碼表示,獲得編碼表示序列,其中,所述目標文本序列是所述目標文本信息的序列表示結(jié)果,以及通過所述內(nèi)容質(zhì)量模型的全連接層,對所述編碼表示序列進行映射,獲得內(nèi)容質(zhì)量評估結(jié)果;
根據(jù)所述先驗體驗評估結(jié)果和所述內(nèi)容質(zhì)量評估結(jié)果,獲得所述待處理圖文內(nèi)容的質(zhì)量評估結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
獲得所述待處理圖文內(nèi)容的排版特征;
獲得所述目標文本信息和所述目標圖片之間的匹配程度;所述排版特征和所述匹配程度屬于目標形式特征。
3.如權(quán)利要求2所述的方法,其特征在于,所述目標形式特征還包括如下的一種或多種:
所述目標圖片的圖片質(zhì)量特征;或,
所述目標文本信息的詞句特征;或,
發(fā)布所述待處理圖文內(nèi)容的賬號等級;或,
所述待處理圖文內(nèi)容的標題特征。
4.如權(quán)利要求1所述的方法,其特征在于,所述梯度提升決策樹模型是通過如下方式訓練得到的:
獲得第一樣本數(shù)據(jù);其中,所述第一樣本數(shù)據(jù)包括多個樣本圖文內(nèi)容中每個樣本圖文內(nèi)容的樣本形式特征,以及每個樣本圖文內(nèi)容對應的先驗體驗評估結(jié)果標簽;
根據(jù)多個樣本形式特征,進行多輪迭代訓練,并在每輪迭代訓練中創(chuàng)建一學習器,并利用損失函數(shù)擬合上一輪迭代訓練結(jié)果的殘差,通過最小化損失函數(shù)擬合本輪創(chuàng)建的學習器;其中,每一輪迭代訓練結(jié)果的殘差是迭代訓練輸出結(jié)果與對應的先驗體驗評估結(jié)果標簽確定的;
根據(jù)多輪迭代訓練中獲得的多個學習器,建立各個學習器的層級關(guān)系,獲得梯度提升決策樹模型。
5.如權(quán)利要求1所述的方法,其特征在于,所述內(nèi)容質(zhì)量模型是通過如下方式訓練得到的:
獲得第二樣本數(shù)據(jù);其中,所述第二樣本數(shù)據(jù)包括樣本圖文內(nèi)容對應的樣本文本序列,以及樣本文本序列對應的內(nèi)容質(zhì)量評估結(jié)果標簽;
通過所述各個編碼單元,按照所述樣本文本序列的輸入順序,并應用注意力機制,生成每個輸入位置對應的樣本編碼表示,獲得樣本編碼表示序列;
通過所述全連接層,對所述樣本編碼表示序列進行映射,獲得預測內(nèi)容質(zhì)量評估結(jié)果;
基于所述內(nèi)容質(zhì)量評估結(jié)果標簽和所述預測內(nèi)容質(zhì)量評估結(jié)果,調(diào)整所述內(nèi)容質(zhì)量模型的模型參數(shù),直到內(nèi)容質(zhì)量模型收斂,獲得已訓練的內(nèi)容質(zhì)量模型。
6.如權(quán)利要求1~3任一項所述的方法,其特征在于,所述根據(jù)所述先驗體驗評估結(jié)果和所述內(nèi)容質(zhì)量評估結(jié)果,獲得所述待處理圖文內(nèi)容的質(zhì)量評估結(jié)果,具體包括:
根據(jù)所述先驗體驗評估結(jié)果和所述內(nèi)容質(zhì)量評估結(jié)果,通過投票機制,對所述待處理圖文內(nèi)容進行投票處理,獲得所述待處理圖文內(nèi)容的質(zhì)量評估結(jié)果。
7.一種圖文內(nèi)容處理方法,其特征在于,包括:
獲得各圖文內(nèi)容的質(zhì)量評價結(jié)果;其中,所述各圖文內(nèi)容的質(zhì)量評價結(jié)果是通過權(quán)利要求1~6中任一項所述的方法獲得的;
根據(jù)所述各圖文內(nèi)容的質(zhì)量評價結(jié)果,從所述各圖文內(nèi)容中確定出目標圖文內(nèi)容,并推薦所述目標圖文內(nèi)容。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011042702.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種煤炭輸送設(shè)備
- 下一篇:蔬菜清洗機
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務系統(tǒng)、內(nèi)容服務器、內(nèi)容終端及內(nèi)容服務方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





