[發明專利]一種從微信中發現特定領域微信公眾號的方法在審
| 申請號: | 201810901757.6 | 申請日: | 2018-08-09 |
| 公開(公告)號: | CN109284431A | 公開(公告)日: | 2019-01-29 |
| 發明(設計)人: | 孫立遠;陳訓遜;王博;徐曉燕;黃亮;謝程利 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/958 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 羅文群 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發現 文章內容 文章信息 賬號信息 數據挖掘技術 初始配置 分類模型 人工干預 全面性 自循環 構建 搜索 關聯 | ||
本發明涉及一種從微信中發現特定領域微信公眾號的方涉,屬于數據挖掘技術領域。所述方法包括:關聯已知特定領域微信公眾號的賬號主體、搜索微信公眾號的賬號信息和文章信息,生成候選特定領域微信公眾號列表,利用構建的待發現特定領域文章分類模型對其文章信息進行判斷,確保其文章內容和特定領域相關,完成從微信中發現特定領域微信公眾號。本發明方法解決了微信公眾號賬號信息和文章內容不符的問題,擴展了待發現目標的來源,且在初始配置后自循環發現,不需要長期人工干預,從而有效提高特定領域微信公眾號發現的準確性、全面性和自增長性。
技術領域
本發明涉及一種從微信中發現特定領域微信公眾號的方法,屬于數據挖掘技術領域。
背景技術
隨著移動智能終端的興起和移動互聯網的快速發展,微信應運而生,并已發展成為移動端主流的即時通訊工具,兼具社交功能。微信公眾平臺建立在微信基礎上,通過這個平臺,機構或個人可以申請并運營微信公眾號,以文字、圖片、語音、視頻等方式實現與特定群體的全方位溝通和互動;用戶可以訂閱感興趣的微信公眾號,接收相關資訊。目前,微信公眾平臺已經成長為一個新興的受眾廣泛的自媒體平臺以及眾多企業和機構進行品牌宣傳推廣的平臺,同時也成為用戶在移動端的重要信息接入口。據統計,2017年微信公眾號已突破2000萬,月活躍賬號數達350萬。如何從如此龐大的微信公眾平臺中及時、準確、全面的發現特定領域的微信公眾號,對于微信公眾號的運營、相關產品營銷、廣告投放以及政府監管等具有重要意義。
現有微信公眾號發現方法主要采用特定領域關鍵詞匹配微信公眾號的賬號信息,包括賬號名稱和功能介紹。但是該方法忽視了微信公眾號的賬號名稱和功能介紹可能與微信公眾號推送的文章內容不一致的問題,導致對微信公眾號的發現不準、不全。
發明內容
本發明的目的是提出一種從微信中發現特定領域微信公眾號的方法,對已有的微信公眾號發現方法作出改進,以達到準確、全面、增量的發現特定領域微信公眾號的目的。
本發明提出的從微信中發現特定領域微信公眾號的方法,包括以下步驟:
(1)初始化:設置一個配置數據庫,在該數據庫中存放配置信息,配置信息包括從已知特定領域微信公眾號中提取的代表性特點,代表性特點包括已知特定領域微信公眾號的列表、關鍵詞集合和賬號主體列表;
(2)通過與已知特定領域微信公眾號的關聯,根據上述數據庫中的關鍵詞集合,搜索微信公眾號的賬號信息和文章信息,生成候選特定領域微信公眾號列表,具體過程如下:
(2-1)根據上述步驟(1)的配置數據庫中的賬號主體列表,搜索微信微信公眾號的賬號主體,若搜索得到與該賬號主體列表相同的賬號主體的微信公眾號,則將該微信公眾號作為候選特定領域微信公眾號,若搜索不到與該賬號主體列表相同的賬號主體的微信公眾號,則進行步驟(2-2);
(2-2)根據上述步驟(1)的配置數據庫中的關鍵詞集合,搜索微信公眾號的賬號信息,賬號信息包括賬號名稱和功能介紹,搜索微信公眾號的賬號名稱和功能介紹,對賬號名稱和功能介紹分別進行判斷,若賬號名稱或功能介紹中的關鍵詞與上述配置數據庫中的關鍵詞一致,則將該微信公眾號作為候選特定領域微信公眾號,若賬號名稱和功能介紹中的關鍵詞與上述配置數據庫中的關鍵詞不一致,則進行步驟(2-3);
(2-3)根據上述步驟(1)的配置數據庫中的關鍵詞集合,搜索微信公眾號的文章信息,文章信息包括文章標題和正文內容,搜索微信公眾號的文章標題和正文內容,對文章標題和正文內容分別進行判斷,若文章標題和正文內容中的關鍵詞與上述配置數據庫中的關鍵詞一致,則將該微信公眾號作為候選特定領域微信公眾號,若賬號名稱和功能介紹中的關鍵詞與上述配置數據庫中的關鍵詞不一致,則返回步驟(1);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心,未經國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810901757.6/2.html,轉載請聲明來源鉆瓜專利網。





