[發明專利]網絡平臺公共賬號分類方法及裝置有效
| 申請號: | 201610102531.0 | 申請日: | 2016-02-24 |
| 公開(公告)號: | CN105787025B | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 黎新;陳謙 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 蔣雅潔;張穎玲 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 平臺 公共 賬號 分類 方法 裝置 | ||
本發明公開了一種網絡平臺公共賬號分類方法及裝置。其中,所述方法包括:從待分類賬號的數據中,獲取表征所述待分類賬號類別屬性的屬性信息;從所述屬性信息中提取分類依據特征;根據所述分類依據特征,按照預先確定的分類模型,對所述待分類賬號進行分類。根據本發明實施例的網絡平臺公共賬號分類方法和裝置能夠對公共賬號進行合理地分類,從而使得公共賬號能夠得到有效的分類組織和管理。
技術領域
本發明涉及互聯網信息處理領域,尤其涉及一種網絡平臺公共賬號分類方法及裝置。
背景技術
為了滿足商業推廣、廣告投放等需求,即時通訊工具、社交網站、支付平臺等網絡平臺為企業、商家或個人用戶提供了公共賬號,以通過網絡平臺向網絡平臺上注冊的終端用戶提供如文字、圖片、語音、視頻的全方位溝通、互動等服務。然而,由于有的公共賬號在注冊的時候,網絡平臺并沒有為其設置類目功能,導致無法對公共賬號進行有效的分類組織和管理,從而不利于從公共賬號中獲取所需要的信息。因此,對公共賬號進行分類成為迫切需要解決的問題。
發明內容
有鑒于此,本發明要解決的技術問題是,如何對由網絡平臺提供的公共賬號進行合理地分類,以使得公共賬號得到有效的分類組織和管理。
為了解決上述技術問題,根據本發明的一個方面,提供了一種網絡平臺公共賬號分類方法,包括:根據用戶與公共賬號的交互頻度,來確定用戶偏好的公共賬號;將所述用戶偏好的公共賬號作為待分類賬號;當所述待分類賬號屬于訂閱類的公共賬號時,從待分類賬號的數據中,獲取包括所述待分類賬號發布的主題的非文本信息、以及包括直接文本信息和間接文本信息的文本信息,將所述非文本信息和所述文本信息中的至少之一作為屬性信息;其中,所述直接文本信息包括所述待分類賬號的昵稱、功能描述、簽名描述中的至少之一,所述間接文本信息包括所述待分類賬號向網絡平臺提供的描述文本;當所述待分類賬號屬于服務類的公共賬號時,從待分類賬號的數據中,獲取包括所述待分類賬號所調用的網絡平臺的接口類別、所述待分類賬號的菜單內容的非文本信息、以及包括直接文本信息和間接文本信息的文本信息,將所述非文本信息和所述文本信息中的至少之一作為屬性信息;從所述屬性信息中提取分類依據特征;其中,當所述待分類賬號屬于訂閱類的公共賬號時,從所述屬性信息中提取的分類依據特征包括所述待分類賬號發布頻率的排名靠前的主題、基于所述直接文本信息生成的關鍵詞和/或n-gram語言模型片段、以及通過語義分析基于所述間接文本信息獲取的主題特征中的至少之一;當所述待分類賬號屬于服務類的公共賬號時,從所述屬性信息中提取的分類依據特征包括所述待分類賬號的服務內容、基于所述直接文本信息生成的關鍵詞和/或n-gram語言模型片段、以及通過語義分析基于所述間接文本信息獲取的主題特征中的至少之一;根據所述分類依據特征,基于一級分類模型,將所述待分類賬號劃分到訂閱類,基于二級分類模型,將所述待分類賬號劃分到較所述訂閱類更細粒度的類別,或,基于一級分類模型,將所述待分類賬號劃分到服務類,基于二級分類模型,將所述待分類賬號劃分到較所述服務類更細粒度的類別,以得到所述用戶偏好的公共賬號的分類結果;其中,所述一級分類模型或二級分類模型的分類依據特征是根據比例大于預定閾值的樣本特征而確定的;所述比例為樣本類別對所述樣本特征的引用數相對于所有樣本類別對所述樣本特征的引用數的比值;基于所述分類結果為所述用戶推送與所述用戶偏好的公共賬號的類別相同或相近的公共賬號。
對于上述網絡平臺公共賬號分類方法,在一種可能的實現方式中,從所述屬性信息中提取分類依據特征包括:根據單位時段內的發布頻率對所述待分類賬號發布的主題進行排序;選取排序在預定閾值以前的主題作為所述分類依據特征。
對于上述網絡平臺公共賬號分類方法,在一種可能的實現方式中,從所述屬性信息中提取分類依據特征包括:對所述直接文本信息進行分詞、去停用詞、實體詞識別、以及文本過濾中的一個或多個處理,以生成字詞序列;從所述字詞序列中抽取關鍵詞和/或n-gram語言模型片段,作為所述分類依據特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610102531.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種重復數據的刪除方法及裝置
- 下一篇:基于hadoop的海量數據挖掘方法





