[發明專利]一種基于并存率與關聯規則的心理行為分析方法有效
| 申請號: | 201811040645.2 | 申請日: | 2018-09-07 |
| 公開(公告)號: | CN109344235B | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 宋耀蓮;田榆杰;武雙新;王慧東;徐文林 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 并存 關聯 規則 心理 行為 分析 方法 | ||
1.一種基于并存率與關聯規則的心理行為分析方法,其特征在于:
Step1、建立人類心理行為詞匯數據的事務數據庫,心理測試者的編號作為標識符tid,每一測試者的所有心理行為詞匯作為一個事務T,所有事務的集合為事務集D;
Step2、(1)掃描事務集D,計算每一個項的并存率ρ,第i項的并存率ρi計算公式為:
式(1)中,support_count(mi)為第i項的總支持度計數;support_count(Si)為第i項的單存項支持度計數;
(2)通過上述所得各項并存率,求出它們的和與項數之比,比值即為最小并存率閾值min_com,計算公式為:
式(2)中,n是項的總數;為所有項的并存率之和;
(3)當第i項的并存率低于最小并存率閾值:
ρi<min_com (3)
則剔除第i項的所有數據,否則,作為強關聯項數據保留并放入新的事務集D1中,進行下一步的數據處理;
單存項:某一事務T中僅存在一個項,即該項在事務集D中有單獨存在的項集;
并存項:某一事務T中存在多個項,每一個項都稱為并存項;
并存率ρ:某并存項與其他并存項同時存在的概率;
Step3、掃描新事務集D1,每個心理行為詞匯作為一個候選1項集c1,所有c1的集合為C1,設置一個最小支持度閾值min_sup,當c1的支持度計數support_count(c1)大于等于min_sup時,則c1成為頻繁1項集l1,所有l1的集合為L1,通過將L1與自身相連接產生候選2項集c2,所有c2的集合為C2,如果C2中第i個候選2項集c2(i)的某個子集為第x個候選1項集c1(x),且它不是L1的元素時,則將c2(i)從C2中刪除;滿足min_sup的c2作為頻繁2項集l2,其集合為L2;依次循環類推,得到不同頻繁項集l2、l3、……lk-1、lk的集合L2、L3……Lk-1、Lk,其中lk-1、lk分別代表頻繁k-1項集和頻繁k項集,Lk-1、Lk則為它們各自的集合;
Step4、設置一個最小置信度閾值min_conf;每個頻繁項集l所產生的每個非空子集為s,若子集(l-s)與s的支持度計數之比大于等于最小置信度閾值min_conf,則輸出強關聯規則該強規則的置信度大小為l與s的支持度計數之比的值
Step5、將所計算出來的所有強關聯規則按照其置信度confidence的大小進行排序,當出現一個或多個心理行為詞匯時,通過關聯規則得出與該心理行為詞匯相關聯的其他心理行為詞匯。
2.根據權利要求1所述的基于并存率與關聯規則的心理行為分析方法,其特征在于:所述步驟Step1中,人類心理行為詞匯數據的事務數據庫具有所有心理測試者的全部心理行為詞匯數據信息,數據字段包括測試者標識符字段與其心理行為詞匯數據字段。
3.根據權利要求1所述的基于并存率與關聯規則的心理行為分析方法,其特征在于:所述步驟Step3中,為得到頻繁k項集的集合Lk,通過將頻繁k-1項集的集合Lk-1與自身相連接產生候選k項集的集合Ck。
4.根據權利要求1所述的基于并存率與關聯規則的心理行為分析方法,其特征在于:所述步驟Step4的關聯規則置信度大小的計算如公式(4)所示:
其中:
式(4)和(5)中,min_conf為最小置信度閾值,l為頻繁項集,l所產生的每個非空子集為s,support_count(l)、support_count(s)、support_count(l-s)分別為括號內字母的支持度計數,為強關聯規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811040645.2/1.html,轉載請聲明來源鉆瓜專利網。





