[發明專利]一種確定用戶標簽的方法及相關裝置在審
| 申請號: | 202011521477.6 | 申請日: | 2020-12-21 |
| 公開(公告)號: | CN112632279A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 龔良泉;葉祺 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/9535;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 柳欣 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 確定 用戶 標簽 方法 相關 裝置 | ||
本申請公開了一種確定用戶標簽的方法及相關裝置,該方法包括:對目標用戶的輸入信息進行自然語言處理,獲得輸入信息中細粒度槽位信息;通過細粒度槽位信息推斷目標用戶的細粒度標簽。其中,用戶的輸入信息是符合用戶個性化習慣的相關輸入內容,其細粒度槽位信息能夠細致地表征用戶個性化標簽信息;則通過挖掘用戶的輸入信息中細粒度槽位信息,利用細粒度槽位信息即可分析得到用戶的標簽;該確定用戶標簽的方式較為方便,且確定的用戶標簽為細粒度標簽,從而便于提高人工智能用戶個性化的性能。
技術領域
本申請涉及數據處理技術領域,尤其涉及一種確定用戶標簽的方法及相關裝置。
背景技術
隨著人工智能的快速發展,各種各樣的人工智能產品不斷推出,人們對人工智能充滿了想象和期待。人工智能中一個重要體現是用戶個性化;即,人工智能產品面對不同用戶時,能夠根據不同用戶的標簽提供個性化的人工智能服務?;诖?,確定用戶的標簽對實現人工智能用戶個性化具有巨大作用,尤其是用戶的細粒度標簽。
目前,一般是通過用戶的社交數據、屬性數據、行為數據等確定用戶的人口屬性標簽、興趣標簽、行為標簽等。但是,該方式確定的用戶的人口屬性標簽、興趣標簽、行為標簽均是粗粒度標簽;即,現有的方式無法或者很難確定用戶的細粒度標簽,無法滿足確定用戶的細粒度標簽的需求,從而影響人工智能用戶個性化的性能。
發明內容
有鑒于此,本申請提供一種確定用戶標簽的方法及相關裝置,該確定用戶標簽的方式較為方便,且確定的用戶標簽為細粒度標簽,從而便于提高人工智能用戶個性化的性能。
第一方面,本申請實施例提供了一種確定用戶標簽的方法,該方法包括:
對目標用戶的輸入信息進行自然語言處理;
獲得所述輸入信息中細粒度槽位信息;
基于所述細粒度槽位信息推斷所述目標用戶的細粒度標簽。
可選的,所述對目標用戶的輸入信息進行自然語言處理,具體為:
利用槽位挖掘算法和意圖分類器對所述輸入信息進行自然語言處理;所述槽位挖掘算法包括槽位挖掘模板或槽位挖掘模型。
可選的,還包括:
確定所述目標用戶所屬的目標用戶聚類簇;
基于所述目標用戶聚類簇中用戶的輸入信息與對應的細粒度槽位信息,調整所述槽位挖掘算法獲得新槽位挖掘算法;
其中,所述利用槽位挖掘算法和意圖分類器對所述輸入信息進行自然語言處理,具體為:
利用所述新槽位挖掘算法和所述意圖分類器對所述輸入信息進行自然語言處理。
可選的,還包括:
基于所述細粒度槽位信息推斷所述目標用戶的人設標簽;
從所述細粒度標簽中篩選與所述人設標簽匹配的細粒度標簽;
確定所述目標用戶的目標細粒度標簽。
可選的,還包括:
確定所述目標用戶所屬的目標用戶聚類簇;
若所述目標用戶聚類簇中預設數量用戶的目標細粒度標簽均包括第一目標細粒度標簽,將所述第一目標細粒度標簽確定為所述目標用戶聚類簇中用戶的目標細粒度標簽;
其中,所述預設數量小于所述目標用戶聚類簇中用戶數量。
可選的,所述確定所述目標用戶所屬的目標用戶聚類簇,具體為:
基于所述目標用戶的相關數據、其他用戶的相關數據,確定所述目標用戶所屬的目標用戶聚類簇;所述相關數據包括社交數據、屬性數據和/或行為數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011521477.6/2.html,轉載請聲明來源鉆瓜專利網。





