[發(fā)明專利]一種用戶自生產(chǎn)內容檢測方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 201810164771.2 | 申請日: | 2018-02-27 |
| 公開(公告)號: | CN110019812B | 公開(公告)日: | 2021-08-20 |
| 發(fā)明(設計)人: | 曹娟;金志威;上官建峰;張勇東;李錦濤 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/30;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京律誠同業(yè)知識產(chǎn)權代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 生產(chǎn) 內容 檢測 方法 系統(tǒng) | ||
1.一種用戶自生產(chǎn)內容檢測方法,其特征在于,包括:
步驟1、獲取社交媒體中用戶自生產(chǎn)內容的文本內容、圖像內容和社交屬性,并從該文本內容中抽取詞向量特征,從該社交屬性中抽取社交屬性特征以及從該圖像內容中抽取圖像特征;
步驟2、通過遞歸神經(jīng)網(wǎng)絡融合該詞向量特征和該社交屬性特征,得到文本、社交融合特征;
步驟3、根據(jù)該遞歸神經(jīng)網(wǎng)絡得到注意力向量,并通過注意力機制將該圖像特征處理為注意力融合特征,將該注意力融合特征與該文本、社交融合特征相融合,生成多模態(tài)融合特征;
步驟4、利用該多模態(tài)融合特征訓練分類器,以檢測該社交媒體中的用戶自生產(chǎn)內容;
其中該步驟2包括:
步驟21、將詞向量特征和其相對應的社交屬性特征相聯(lián)結,得到融合特征,將該融合特征輸入至遞歸神經(jīng)網(wǎng)絡中各遞歸層,并將各遞歸層輸出的向量經(jīng)過聚合求平均后,得到該文本、社交融合特征;
該步驟3包括:
步驟31、將該遞歸神經(jīng)網(wǎng)絡中各遞歸層輸出的向量輸入至全連接層,得到與該圖像特征相同維度的向量,作為該注意力向量;
步驟32、以該注意力向量為權值,對該圖像特征的每一維度進行加權求和處理,得到注意力值;
步驟33、聯(lián)結該注意力值,得到該注意力融合特征。
2.如權利要求1所述的用戶自生產(chǎn)內容檢測方法,其特征在于,該步驟1包括:
步驟11、將該文本內容進行分詞處理,得到多個單詞,針對每個單詞利用詞向量嵌入模型得到對應的向量表示,并將該向量表示集合為該詞向量特征;
步驟12、將組織為向量形式的該社交屬性輸入至全連接層,以生成與該詞向量特征維度相等的該社交屬性特征;
步驟13、將該圖像內容輸入至卷積神經(jīng)網(wǎng)絡,并對抽取出的特征進行降維處理,得到該圖像特征。
3.如權利要求1所述的用戶自生產(chǎn)內容檢測方法,其特征在于,該步驟4還包括:使用該多模態(tài)特征和標注的指定用戶自生產(chǎn)內容數(shù)據(jù),訓練得到該分類器,將待檢測的用戶自生產(chǎn)內容的多模態(tài)特征輸入該分類器,以檢測該社交媒體中的用戶自生產(chǎn)內容。
4.一種用戶自生產(chǎn)內容檢測系統(tǒng),其特征在于,包括:
特征抽取模塊,用于獲取社交媒體中用戶自生產(chǎn)內容的文本內容、圖像內容和社交屬性,并從該文本內容中抽取詞向量特征,從該社交屬性中抽取社交屬性特征以及從該圖像內容中抽取圖像特征;
特征融合模塊,用于通過遞歸神經(jīng)網(wǎng)絡融合該詞向量特征和該社交屬性特征,得到文本、社交融合特征,根據(jù)該遞歸神經(jīng)網(wǎng)絡得到注意力向量,并通過注意力機制將該圖像特征處理為注意力融合特征,將該注意力融合特征與該文本、社交融合特征相融合,生成多模態(tài)融合特征;
訓練模塊,用于利用該多模態(tài)融合特征訓練分類器,以檢測該社交媒體中的用戶自生產(chǎn)內容;
其中該特征融合模塊包括:
將詞向量特征和其相對應的社交屬性特征相聯(lián)結,得到融合特征,將該融合特征輸入至遞歸神經(jīng)網(wǎng)絡中各遞歸層,并將各遞歸層輸出的向量經(jīng)過聚合求平均后,得到該文本、社交融合特征;
該特征融合模塊包括:
將該遞歸神經(jīng)網(wǎng)絡中各遞歸層輸出的向量輸入至全連接層,得到與該圖像特征相同維度的向量,作為該注意力向量;
以該注意力向量為權值,對該圖像特征的每一維度進行加權求和處理,得到注意力值;
聯(lián)結該注意力值,得到該注意力融合特征。
5.如權利要求4所述的用戶自生產(chǎn)內容檢測系統(tǒng),其特征在于,該特征抽取模塊包括:
將該文本內容進行分詞處理,得到多個單詞,針對每個單詞利用詞向量嵌入模型得到對應的向量表示,并將該向量表示集合為該詞向量特征;
將組織為向量形式的該社交屬性輸入至全連接層,以生成與該詞向量特征維度相等的該社交屬性特征;
將該圖像內容輸入至卷積神經(jīng)網(wǎng)絡,并對抽取出的特征進行降維處理,得到該圖像特征。
6.如權利要求4所述的用戶自生產(chǎn)內容檢測系統(tǒng),其特征在于,該訓練模塊還包括:使用該多模態(tài)特征和標注的指定用戶自生產(chǎn)內容數(shù)據(jù),訓練得到該分類器,將待檢測的用戶自生產(chǎn)內容的多模態(tài)特征輸入該分類器,以檢測該社交媒體中的用戶自生產(chǎn)內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經(jīng)中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810164771.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 生產(chǎn)系統(tǒng)和生產(chǎn)方法
- 生產(chǎn)設備和生產(chǎn)方法
- 生產(chǎn)系統(tǒng)及產(chǎn)品生產(chǎn)方法
- 生產(chǎn)藥品的生產(chǎn)線和包括該生產(chǎn)線的生產(chǎn)車間
- 生產(chǎn)輔助系統(tǒng)、生產(chǎn)輔助方法以及生產(chǎn)輔助程序
- 生產(chǎn)系統(tǒng)、生產(chǎn)裝置和生產(chǎn)系統(tǒng)的控制方法
- 石料生產(chǎn)機制砂生產(chǎn)系統(tǒng)
- 生產(chǎn)系統(tǒng)以及生產(chǎn)方法
- 生產(chǎn)系統(tǒng)及生產(chǎn)方法
- 生產(chǎn)系統(tǒng)和生產(chǎn)方法
- 內容再現(xiàn)系統(tǒng)、內容提供方法、內容再現(xiàn)裝置、內容提供裝置、內容再現(xiàn)程序和內容提供程序
- 內容記錄系統(tǒng)、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統(tǒng)、內容服務器、內容終端及內容服務方法
- 內容分發(fā)系統(tǒng)、內容分發(fā)裝置、內容再生終端及內容分發(fā)方法
- 內容發(fā)布、內容獲取的方法、內容發(fā)布裝置及內容傳播系統(tǒng)
- 內容提供裝置、內容提供方法、內容再現(xiàn)裝置、內容再現(xiàn)方法
- 內容傳輸設備、內容傳輸方法、內容再現(xiàn)設備、內容再現(xiàn)方法、程序及內容分發(fā)系統(tǒng)
- 內容發(fā)送設備、內容發(fā)送方法、內容再現(xiàn)設備、內容再現(xiàn)方法、程序及內容分發(fā)系統(tǒng)
- 內容再現(xiàn)裝置、內容再現(xiàn)方法、內容再現(xiàn)程序及內容提供系統(tǒng)
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





