[發明專利]一種股票資訊新聞中心詞和相關股票的關聯度量方法在審
| 申請號: | 201811318217.1 | 申請日: | 2018-11-07 |
| 公開(公告)號: | CN109508386A | 公開(公告)日: | 2019-03-22 |
| 發明(設計)人: | 王家華;薛醒思;詹先銀;朱鐘元;范淑娟;劉艷萍;楊瑩 | 申請(專利權)人: | 福建工程學院 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F16/9535 |
| 代理公司: | 福州市鼓樓區京華專利事務所(普通合伙) 35212 | 代理人: | 林曉琴 |
| 地址: | 350000 福建省福州*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 股票資訊 頻繁項集 關聯度 新聞關鍵詞 股票 事務數據庫 關聯規則 數據庫 讀取 計算效率 挖掘算法 真子集 中心詞 補集 預備 | ||
1.一種股票資訊新聞關鍵詞和相關股票的關聯度量方法,其特征在于:包括:
步驟S10、讀取預備的股票資訊新聞文件中的數據,并構造事務數據庫D,D={T1,T2,T3,…,Ti},事務Ti表示來自同一篇股票資訊新聞關鍵詞組成的項集,i∈[1,n],n表示所述股票資訊新聞文件中收錄的相關股票資訊新聞的篇數;
步驟S20、從事務數據庫D中窮盡所有的頻繁項集,并生成頻繁項集數據庫L與頻繁項集組Lk,L={L1,L2,L3,…,Lk},Lk={Fk.1,Fk.2,Fk.3,…,Fk.m},頻繁項集Fk.m表示由k個股票資訊新聞關鍵詞組成的頻繁k項集,m表示序號,k與m均為正整數;
步驟S30、從所述頻繁項集Fk,m計算出有共現關系的若干個關聯規則α→β,項集α為Fk.m的非空真子集,項集β為所述項集α關于所述頻繁項集Fk.m的補集,并將所述關聯規則α→β歸入詞共現數據庫。
2.根據權利要求1所述的一種股票資訊新聞關鍵詞和相關股票的關聯度量方法,其特征在于:所述步驟S20具體包括:
步驟S21、掃描所述事務數據庫D,生成候選項集組C1,C1={E1.1,E1.2,E1.3,…,E1.w},候選項集E1.j表示由1個股票資訊新聞關鍵詞組成的1項集,w表示序號且為正整數;
步驟S22、計算所述候選項集E1.w在所述事務數據庫D中的支持度計數count(E1.j),如果所述支持度計數count(E1.w)大于等于預設的最小支持度計數閾值,則將所述候選項集E1.w歸入頻繁項集組L1;如果所述支持度計數count(E1.w)小于所述預設的最小支持度計數閾值,則去除所述候選項集E1.w;
步驟S23、將頻繁項集組Lh-1中的頻繁項集Fh-1.m生成候選項集Eh.s,所述候選項集Eh.s表示由h個所述股票資訊新聞關鍵詞組成的h項集,s表示序號且為正整數,h為大于等于2的整數;
步驟S24、對所述候選項集Eh.s進行非頻繁剪枝處理,然后生成候選項集組Ch,Ch={Eh.1,Eh.2,…,Eh.j},j表示序號且為正整數;
步驟S25、計算候選項集Eh.j在所述事務數據庫D中的支持度計數count(Eh.j),如果所述支持度計數count(Eh.j)大于等于所述最小支持度計數閾值,則將所述候選項集Eh.j歸入所述頻繁項集組Lh,如果所述支持度計數count(Eh.j)小于最小支持度計數閾值,則去除所述候選項集Eh.j;
步驟S26、從所述煩繁項集組Lh中生成候選項集組Ch+1,如果所述候選項集組Ch+1為空,則所述煩繁項集組Lh即為最大頻繁項集組,最后得出所述頻繁項集數據庫L;如果所述候選項集組Ch+1不為空,則轉到所述步驟S25。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建工程學院,未經福建工程學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811318217.1/1.html,轉載請聲明來源鉆瓜專利網。





