[發明專利]用戶信息的處理方法、裝置、介質及電子設備在審
| 申請號: | 202110649579.4 | 申請日: | 2021-06-10 |
| 公開(公告)號: | CN113343069A | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 陳維識 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/955;G06F16/906;G06K9/62 |
| 代理公司: | 北京英創嘉友知識產權代理事務所(普通合伙) 11447 | 代理人: | 賈會玲 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶信息 處理 方法 裝置 介質 電子設備 | ||
本公開涉及一種用戶信息的處理方法、裝置、介質及電子設備,所述方法包括:獲取多個閱讀序列信息;對所述多個閱讀序列信息中的作者信息進行聚類,獲得多個作者信息簇;針對每一所述作者信息簇,根據所述作者信息簇中每一所述作者信息對應的顯著度參數,確定所述作者信息簇中的目標作者信息;根據所述目標作者信息對應的特征信息,生成所述目標作者信息所屬的作者信息簇的特征標識。由此可以自動生成特征標識,便于為該作者信息簇中的作者關聯標識,有效降低人工工作量,實現用戶信息的自動化處理。另一方面,可以提高確定出的特征標識的準確性和精度。
技術領域
本公開涉及計算機技術領域,具體地,涉及一種用戶信息的處理方法、裝置、介質及電子設備。
背景技術
隨著計算機技術的發展,互聯網中的數據也越來越多。為了便于用戶可以更加準確、快捷地從互聯網獲取滿足其需求的數據,通??梢詾閿祿砑犹卣髅枋龅臉俗R,從而可以確定該數據所具備的特征,便于用戶查找。
相關技術中,在互聯網的內容中,通常會基于人工對作者添加相應地的垂類標簽(垂直領域標簽,相同垂直領域下的用戶一般具有類似的需求、愛好等),而人工添加的垂類標簽粒度過大會使得內容的描述偏差較大,人工添加的垂類標簽粒度過小則會使得具有相近特征的內容對應于不同的特征描述,難以實現對內容的特征的準確描述,導致后續進行數據查詢或數據管理的難度增大。
發明內容
提供該發明內容部分以便以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。該發明內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
第一方面,本公開提供一種用戶信息的處理方法,所述方法包括:
獲取多個閱讀序列信息,其中,每一所述閱讀序列信息中包含同一用戶閱讀的多個內容分別對應的作者信息;
對所述多個閱讀序列信息中的作者信息進行聚類,獲得多個作者信息簇;
針對每一所述作者信息簇,根據所述作者信息簇中每一所述作者信息對應的顯著度參數,確定所述作者信息簇中的目標作者信息,其中,所述顯著度參數用于表示所述作者信息在所述作者信息簇中的顯著程度;
根據所述目標作者信息對應的特征信息,生成所述目標作者信息所屬的作者信息簇的特征標識。
第二方面,本公開提供一種用戶信息的處理裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取多個閱讀序列信息,其中,每一所述閱讀序列信息中包含同一用戶閱讀的多個內容分別對應的作者信息;
聚類模塊,用于對所述多個閱讀序列信息中的作者信息進行聚類,獲得多個作者信息簇;
第一確定模塊,用于針對每一所述作者信息簇,根據所述作者信息簇中每一所述作者信息對應的顯著度參數,確定所述作者信息簇中的目標作者信息,其中,所述顯著度參數用于表示所述作者信息在所述作者信息簇中的顯著程度;
生成模塊,用于根據所述目標作者信息對應的特征信息,生成所述目標作者信息所屬的作者信息簇的特征標識。
第三方面,提供一種計算機可讀介質,其上存儲有計算機程序,該程序被處理裝置執行時實現第一方面所述方法的步驟。
第四方面,提供一種電子設備,包括:
存儲裝置,其上存儲有計算機程序;
處理裝置,用于執行所述存儲裝置中的所述計算機程序,以實現第一方面所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110649579.4/2.html,轉載請聲明來源鉆瓜專利網。





