[發明專利]一種組織成員興趣愛好挖掘方法有效
| 申請號: | 201810558855.4 | 申請日: | 2018-06-01 |
| 公開(公告)號: | CN108829793B | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 周佳勇;司華友;萬健;陳志輝;吳浩鵬;孫文 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/216;G06F40/247;G06F40/289;G06Q50/00 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 王桂名 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 組織 成員 興趣愛好 挖掘 方法 | ||
本發明涉及一種組織成員興趣愛好挖掘方法,包括以下步驟:從推文中提取出現頻率較高的多個原始興趣項;按照原始興趣項的頻率進行排序,原始興趣項出現的頻次為其原始權重;根據興趣關聯規則得到高頻興趣項的關聯興趣項集合;逐一提取原始興趣項,若某個原始興趣項滿足關聯規則且在關聯興趣項集合存在一個關聯興趣項,且該關聯興趣項與另一個原始興趣項相同,則增加另一個原始興趣項的權重;對處理后的原始興趣項按照權重重新進行排序,提取前幾個原始興趣項作為該組織成員的興趣項。通過本方法挖掘的興趣愛好的查全率和查準率均得到提高,挖掘效果更好。
技術領域
本發明涉及數據挖掘技術領域,尤其涉及一種組織成員興趣愛好挖掘方法。
背景技術
隨著互聯網的迅猛發展及普及,互聯網組織成員的使用習慣已從最初的自己尋找內容轉變為依賴服務方給予的內容推送,因此精確地了解每個組織成員興趣點,能有效幫助服務方提供個性化的服務,提高組織成員的使用體驗。
在興趣愛好挖掘方面,Deng L等提出一種基于標簽和雙向交互的算法來挖掘中國最大的社交服務之一新浪微博的組織成員的話題興趣。該算法通過組織成員交互圖的制定,充分地利用了組織成員之間的相互作用的差異,結果表明,該算法在準確率和召回率方面優于其他方法,能夠有效挖掘組織成員對標簽和雙向交互的興趣。
Vu T等構建了一個從Twitter(一家美國社交網絡及微博客服務的網站)消息中提取組織成員興趣的系統,該系統使用語言模式提取感興趣的候選項,并使用四種不同的關鍵詞排序技術對其進行排序:TF-IDF,Text Rank,LDA-Text Rank和RI-Rank。結果表明TF-IDF和Text Rank都適合從推文中提取組織成員興趣。
Bao H等提出了一個基于時間和社交概率矩陣分解模型來預測組織成員在博文中的潛在興趣。該模型分析了時間信息和組織成員活動對組織成員潛在特征空間及其興趣主題的影響,提供了融合時間信息和社交網絡結構的統一方式,以準確預測組織成員未來的興趣。
這些互聯網組織成員興趣挖掘的方法分別基于訪問日志,微博或博客的瀏覽內容和行為。但是,現有的研究工作很少涉及興趣愛好本身的內在關系及這些內在關系在興趣愛好挖掘中的應用。
發明內容
本發明的目的在于針對現有技術中存在的缺陷,提出組織成員興趣愛好挖掘方法。為了達到目的,本發明提供的技術方案為:
本發明涉及的一種組織成員興趣愛好挖掘方法,包括以下步驟:
(1)從社交網站所有組織成員的個人檔案中整理出多個高頻興趣項,并從某個組織成員的推文中挖掘n個與高頻興趣項相同的興趣項作為原始興趣項,n為大于1的整數;
(2)根據原始興趣項的出現頻次,對原始興趣項排序,形成原始興趣項列表,記為ittsSet 1~ittsSet n,形成原始興趣項集合,ittsSet 1~ittsSet n對應的原始興趣項初始權重w分別為w 1~w n,w 1~w n為對應的原始興趣項的出現頻次;
(3)根據興趣愛好關聯規則分析高頻興趣項的關聯性,形成關聯興趣項集合ruleSet 1~ruleSet m,m為大于1的整數;
(4)逐一提取原始興趣項ittsSet x,若其存在關聯興趣項,該關聯興趣項存在于關聯興趣項集合中,記為ruleSet y,且該關聯興趣項ruleSet y與另一個原始興趣項ittsSet x’相同,則增加原始興趣項ittsSet x’的權重為W,x和x’為1~n中的任一整數且互不相等,y為1~m中的任一整數,其余原始興趣項的權重保持不變;
(5)根據新的權重重新排列原始興趣項的順序,得到該組織成員興趣項列表,選取權重最大的一個或多個興趣項作為該組織成員的興趣項。
優選地,所述的步驟1中采用分詞算法從所有組織成員個人檔案中的整理高頻興趣項。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810558855.4/2.html,轉載請聲明來源鉆瓜專利網。





