[發明專利]一種從微信中發現特定領域微信公眾號的方法在審
| 申請號: | 201810901757.6 | 申請日: | 2018-08-09 |
| 公開(公告)號: | CN109284431A | 公開(公告)日: | 2019-01-29 |
| 發明(設計)人: | 孫立遠;陳訓遜;王博;徐曉燕;黃亮;謝程利 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/958 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 羅文群 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發現 文章內容 文章信息 賬號信息 數據挖掘技術 初始配置 分類模型 人工干預 全面性 自循環 構建 搜索 關聯 | ||
1.一種從微信中發現特定領域微信公眾號的方法,其特征在于該方法包括以下步驟:
(1)初始化:設置一個配置數據庫,在該數據庫中存放配置信息,配置信息包括從已知特定領域微信公眾號中提取的代表性特點,代表性特點包括已知特定領域微信公眾號的列表、關鍵詞集合和賬號主體列表;
(2)通過與已知特定領域微信公眾號的關聯,根據上述數據庫中的關鍵詞集合,搜索微信公眾號的賬號信息和文章信息,生成候選特定領域微信公眾號列表,具體過程如下:
(2-1)根據上述步驟(1)的配置數據庫中的賬號主體列表,搜索微信微信公眾號的賬號主體,若搜索得到與該賬號主體列表相同的賬號主體的微信公眾號,則將該微信公眾號作為候選特定領域微信公眾號,若搜索不到與該賬號主體列表相同的賬號主體的微信公眾號,則進行步驟(2-2);
(2-2)根據上述步驟(1)的配置數據庫中的關鍵詞集合,搜索微信公眾號的賬號信息,賬號信息包括賬號名稱和功能介紹,搜索微信公眾號的賬號名稱和功能介紹,對賬號名稱和功能介紹分別進行判斷,若賬號名稱或功能介紹中的關鍵詞與上述配置數據庫中的關鍵詞一致,則將該微信公眾號作為候選特定領域微信公眾號,若賬號名稱和功能介紹中的關鍵詞與上述配置數據庫中的關鍵詞不一致,則進行步驟(2-3);
(2-3)根據上述步驟(1)的配置數據庫中的關鍵詞集合,搜索微信公眾號的文章信息,文章信息包括文章標題和正文內容,搜索微信公眾號的文章標題和正文內容,對文章標題和正文內容分別進行判斷,若文章標題和正文內容中的關鍵詞與上述配置數據庫中的關鍵詞一致,則將該微信公眾號作為候選特定領域微信公眾號,若賬號名稱和功能介紹中的關鍵詞與上述配置數據庫中的關鍵詞不一致,則返回步驟(1);
(3)將上述步驟(2-1)、(2-2)和(2-3)中的候選特定領域微信公眾號與上述步驟(1)的配置數據庫中的公眾號列表進行對比,若上述步驟(2-1)、(2-2)和(2-3)中的候選特定領域微信公眾號沒有出現在配置數據庫中的公眾號列表中,則進行步驟(4),若上述步驟(2-1)、(2-2)和(2-3)中的候選特定領域微信公眾號出現在配置數據庫中的公眾號列表中,則將該微信公眾號丟棄;遍歷上述步驟(2-1)、(2-2)和(2-3)中的所有候選特定領域微信公眾號,若上述步驟(2-1)、(2-2)和(2-3)中的候選特定領域微信公眾號全部出現在配置數據庫中的公眾號列表中,則返回步驟(1);
(4)獲取上述步驟(3)中的候選特定領域微信公眾號的文章信息,文章信息包括文章標題和正文內容;
(5)采用分詞和詞向量表示學習方法,利用上述步驟(1)的配置數據庫中的已知特定領域微信公眾號的列表和關鍵詞集合,構建一個待發現特定領域的文章分類模型;
(6)利用上述步驟(5)的待發現特定領域的文章分類模型,對上述步驟(4)中的文章信息進行判斷,若文章信息符合上述文章所屬領域,則進入步驟(7),若文章信息不符合上述文章所屬領域,則丟棄該文章信息所對應的候選特定領域微信公眾號,遍歷上述步驟(4)獲取的所有候選特定領域微信公眾號的文章信息,若文章信息全部不符合上述文章所屬領域,則進行步驟(1);
(7)將候選特定領域微信公眾號作為發現的特定領域微信公眾號,并將該發現的特定領域微信公眾號保存到上述步驟(1)的配置數據庫中的已知特定領域微信公眾號列表中;
(8)用上述步驟(7)發現的特定領域微信公眾號信息更新上述步驟(1)的配置數據庫;
(9)重復上述步驟(2)-步驟(8),完成從微信中發現特定領域微信公眾號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心,未經國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810901757.6/1.html,轉載請聲明來源鉆瓜專利網。





