[發明專利]具有職業和非職業內容的用戶饋送在審
| 申請號: | 201680002451.6 | 申請日: | 2016-07-14 |
| 公開(公告)號: | CN108604230A | 公開(公告)日: | 2018-09-28 |
| 發明(設計)人: | 張梁;L·朱;D·王;S·趙;Y·劉;S·陳 | 申請(專利權)人: | 微軟技術許可有限責任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 徐紅燕;杜荔南 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 帖子 饋送 社交網站 集群 分類 計算機程序 學習分類器 機器學習 訓練機器 語義含義 分類器 調用 分配 單詞 關聯 優化 | ||
1.一種方法,包括:
訓練機器學習分類器以基于多個特征將社交網站的帖子分類為職業帖子或非職業帖子,所述多個特征包括來自分配給每個帖子的多個集群中的集群;
識別用于放置在社交網站的用戶饋送中的多個帖子,每個帖子與得分相關聯;
基于所述帖子中的單詞的語義含義,將來自所述多個帖子的每個帖子分配給所述多個集群中的一個;
調用所述機器學習分類器以將每個帖子分類為職業帖子或非職業帖子;
增加被分類為職業帖子的所述帖子的得分;以及
基于每個帖子的得分對所述多個帖子進行排名以用于呈現在所述用戶饋送中,其中所述方法的操作由處理器來執行。
2.如權利要求1所述的方法,其中每個帖子的分配進一步包括:
為所述帖子中的每個單詞計算語義向量;
基于針對所述帖子中的單詞的語義向量來計算針對所述帖子的語義向量;以及
對所述帖子的語義向量進行k均值聚類以獲得識別被分配給所述帖子的集群的帖子集群標識符。
3.如權利要求2所述的方法,其中所述語義向量是在多維空間中,其中將每個語義向量定位在所述多維空間中,使得共享語義含義的單詞接近地位于所述多維空間中。
4.如權利要求1所述的方法,其中針對每個帖子的得分是基于針對所述帖子的呈現的點進率。
5.如權利要求1所述的方法,其中所述職業帖子與所述帖子的發帖者的職業活動相關聯,其中所述非職業帖子不與所述帖子的發帖者的職業活動相關聯。
6.如權利要求1所述的方法,其中所述機器學習分類器的訓練進一步包括:
獲得由一個或多個人針對多個訓練帖子輸入的鑒定;
向分類器訓練程序輸入所述多個訓練帖子、針對所述多個訓練帖子的所述鑒定以及所述多個特征;以及
執行所述分類器訓練程序以訓練所述機器學習分類器。
7.如權利要求1所述的方法,其中所述多個特征進一步包括以下中的一個或多個:所述帖子的長度;所述帖子是否包括圖片;選自評論、共享或原始帖子中的所述帖子的類型;所述帖子的發帖者的聲譽以及發帖時間。
8.如權利要求1所述的方法,其中增加被分類為職業帖子的帖子的得分包括將被分類為職業帖子的帖子的得分乘以大于1的常數。
9.如權利要求1所述的方法,其中對所述多個職業帖子進行排名進一步包括:按照所述帖子的得分的降序對所述帖子進行整理,其中將具有較高得分的帖子在所述用戶饋送中呈現在具有較低得分的帖子前面。
10.如權利要求1所述的方法,其中針對所述非職業帖子的得分由機器學習算法基于選自包括以下的群組的至少一個或多個特征來確定:查看者與發帖者之間的歷史關系、所述查看者與所述發帖者之間的連接強度、所述帖子的類型、所述帖子中的文本、所述帖子的長度、所述發帖者的簡檔以及所述查看者的簡檔。
11.一種系統,包括:
包括指令的存儲器;以及
一個或多個計算機處理器,其中所述指令在由所述一個或多個計算機處理器執行時引起所述一個或多個計算機處理器實行包括以下的操作:
訓練機器學習分類器以基于多個特征將社交網站的帖子分類為職業帖子或非職業帖子,所述多個特征包括來自分配給每個帖子的多個集群中的集群;
識別用于放置在社交網站的用戶饋送中的多個帖子,每個帖子與得分相關聯;
基于所述帖子中的單詞的語義含義,將來自所述多個帖子的每個帖子分配給所述多個集群中的一個;
調用所述機器學習分類器以將每個帖子分類為職業帖子或非職業帖子;
增加被分類為職業帖子的所述帖子的得分;以及
基于每個帖子的得分對所述多個帖子進行排名以用于呈現在所述用戶饋送中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟技術許可有限責任公司,未經微軟技術許可有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680002451.6/1.html,轉載請聲明來源鉆瓜專利網。





