[發明專利]文本信息分類處理方法、電子設備及計算機可讀存儲介質有效
| 申請號: | 202010183299.4 | 申請日: | 2020-03-16 |
| 公開(公告)號: | CN111400452B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 徐挺洋;卞天;榮鈺;黃俊洲 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F16/9536;G06F18/241;G06N3/0464;G06N3/08;G06Q50/00 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 信息 分類 處理 方法 電子設備 計算機 可讀 存儲 介質 | ||
本申請實施例公開了一種基于人工智能技術的互聯網文本信息分類處理方法、電子設備及計算機可讀存儲介質,包括:根據目標文本信息的轉發關系和回復關系,確定目標文本信息的傳播結構;將傳播結構輸入到雙向圖卷積神經網絡中,得到分類信息,分類信息是根據雙向圖卷積神經網絡的目標特征信息確定出的,雙向圖卷積神經網絡包括自頂向下結構的第一圖卷積神經網絡和自底向上結構的第二圖卷積神經網絡,目標特征信息是根據第一特征信息和第二特征信息確定出的,第一特征信息是根據傳播結構確定出的第一圖卷積神經網絡的特征信息,第二特征信息是根據傳播結構確定出的第二圖卷積神經網絡的特征信息;根據分類信息對目標文本信息進行分類處理。
技術領域
本申請實施例涉及互聯網技術領域,具體而言,本申請涉及一種基于人工智能技術的互聯網文本信息分類處理方法、電子設備及計算機可讀存儲介質。
背景技術
隨著互聯網的快速發展,社交媒體已經成為用戶獲取信息、表達意見的便捷在線平臺。由于社交媒體使用方便且用戶眾多,導致社交媒體上的信息量飛速增長,飛速增長的信息量中難免存在很多謠言,給社會帶來巨大危害。于是,如何快速有效地識別社交媒體上的謠言引起了廣泛研究,比如基于傳統的機器學習方法的謠言檢測,又比如基于各種神經網絡的謠言檢測。
然而,本申請的發明人在具體實現過程中發現:傳統的機器學習方法雖然在謠言檢測問題上取得了一定效果,但其依賴人工提取特征,十分耗時費力;循環神經網絡、卷積神經網絡等,則忽視了謠言的傳播結構所包含的特征,遞歸神經網絡則聚合了更多來自于葉子節點的信息,這與謠言傳播過程中越晚發布的帖子的信息量越少相違背,難以提高謠言檢測的準確度。
發明內容
本申請實施例的目的旨在至少能解決上述的技術缺陷之一,特提出以下技術方案:
一方面,提供了一種文本信息分類處理方法,包括:
根據目標文本信息的轉發關系和回復關系,確定目標文本信息的傳播結構;
將傳播結構輸入到雙向圖卷積神經網絡中,得到目標文本信息的分類信息,其中,分類信息是根據雙向圖卷積神經網絡的目標特征信息確定出的,雙向圖卷積神經網絡包括自頂向下結構的第一圖卷積神經網絡和自底向上結構的第二圖卷積神經網絡,目標特征信息是根據第一特征信息和第二特征信息確定出的,第一特征信息是根據傳播結構確定出的第一圖卷積神經網絡的特征信息,第二特征信息是根據傳播結構確定出的第二圖卷積神經網絡的特征信息;
根據分類信息對目標文本信息進行分類處理。
一方面,提供了一種文本信息分類處理裝置,包括:
第一確定模塊,用于根據目標文本信息的轉發關系和回復關系,確定目標文本信息的傳播結構;
第一處理模塊,用于將傳播結構輸入到雙向圖卷積神經網絡中,得到目標文本信息的分類信息,其中,分類信息是根據雙向圖卷積神經網絡的目標特征信息確定出的,雙向圖卷積神經網絡包括自頂向下結構的第一圖卷積神經網絡和自底向上結構的第二圖卷積神經網絡,目標特征信息是根據第一特征信息和第二特征信息確定出的,第一特征信息是根據傳播結構確定出的第一圖卷積神經網絡的特征信息,第二特征信息是根據傳播結構確定出的第二圖卷積神經網絡的特征信息;
第二處理模塊,用于根據分類信息對目標文本信息進行分類處理。
在一種可能的實現方式中,根據傳播結構確定第一圖卷積神經網絡的特征信息,得到第一特征信息是通過第一特征確定模塊實現的,第一特征確定模塊用于:
確定傳播結構的第一鄰接矩陣和特征矩陣,第一鄰接矩陣包括傳播結構中從上層節點到下層節點之間的各個邊,特征矩陣包括傳播結構中每個節點的特征向量,每個節點的特征向量為該每個節點對應的文本的詞向量的詞頻逆文本頻率值;
對第一鄰接矩陣中的部分邊進行丟棄,得到第二鄰接矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010183299.4/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





