[發明專利]一種組織成員興趣愛好挖掘方法有效
| 申請號: | 201810558855.4 | 申請日: | 2018-06-01 |
| 公開(公告)號: | CN108829793B | 公開(公告)日: | 2021-09-24 |
| 發明(設計)人: | 周佳勇;司華友;萬健;陳志輝;吳浩鵬;孫文 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/216;G06F40/247;G06F40/289;G06Q50/00 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 王桂名 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 組織 成員 興趣愛好 挖掘 方法 | ||
1.一種組織成員興趣愛好挖掘方法,其特征在于,包括以下步驟:
(1)從所有組織成員個人檔案中整理出多個高頻興趣項,并從某個組織成員的推文中挖掘n個與高頻興趣項相同的興趣項作為原始興趣項,n為大于1的整數;
(2)根據原始興趣項的出現頻次,對原始興趣項排序,形成原始興趣項列表,記為ittsSet 1~ittsSet n,形成原始興趣項集合,ittsSet 1~ittsSet n對應的原始興趣項初始權重w分別為w1~wn,w1~wn為對應的原始興趣項的出現頻次;
(3)根據興趣愛好關聯規則分析高頻興趣項的關聯性,形成關聯興趣項集合ruleSet 1~ruleSet m,m為大于1的整數;
(4)逐一提取原始興趣項ittsSet x,若其存在關聯興趣項,該關聯興趣項存在于關聯興趣項集合中,記為ruleSet y,且該關聯興趣項ruleSet y與另一個原始興趣項ittsSetx’相同,則增加原始興趣項ittsSet x’的權重為W,x和x’為1~n中的任一整數且互不相等,y為1~m中的任一整數,其余原始興趣項的權重保持不變,所述的原始興趣項ittsSet x’的權重為W的計算方式為:
W=w+k×r
其中,參數k是設定關聯規則對于興趣愛好挖掘的影響能力的常數,參數r為原始興趣項ittsSet x是該組織成員真實的興趣項的概率;
(5)根據新的權重重新排列原始興趣項的順序,得到該組織成員興趣項列表,選取權重最大的一個或多個興趣項即為該組織成員的興趣項。
2.根據權利要求1所述的組織成員興趣愛好挖掘方法,其特征在于:所述的步驟1中采用分詞算法從所有組織成員個人檔案中的整理高頻興趣項。
3.根據權利要求2所述的組織成員興趣愛好挖掘方法,其特征在于,所述的分詞算法包括以下步驟:
(1.1)從社交網站所有組織成員的個人檔案中整理出描述興趣的興趣詞;
(1.2)經過人工校對,將表達意思相同的興趣詞聚合形成同義詞集合,每組同義詞集合對應一種興趣項;
(1.3)將社交網站中由組織成員填寫的興趣詞替換為對應的興趣項;
(1.4)計算出所有興趣項出現的頻率,并記錄多個高頻興趣項。
4.根據權利要求1所述的組織成員興趣愛好挖掘方法,其特征在于,所述的步驟3中興趣愛好關聯規則的挖掘的方法,包括以下步驟:
(3.1)設定最小置信度閾值min_conf和最小支持度閾值min_sup;
(3.2)找出支持度大于最小支持度閾值min_sup,并且置信度大于最小置信度閾值min_conf的關聯項作為原始興趣項的關聯興趣項;
(3.4)記錄所有關聯興趣項形成關聯興趣項集合。
5.根據權利要求4所述的組織成員興趣愛好挖掘方法,其特征在于:所述的最小置信度閾值min_conf為20%,最小支持度閾值min_sup為0.4%。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810558855.4/1.html,轉載請聲明來源鉆瓜專利網。





