[發明專利]一種挖掘規則關聯模型未知關聯關系的方法及裝置有效
| 申請號: | 201710556213.6 | 申請日: | 2017-07-10 |
| 公開(公告)號: | CN107315831B | 公開(公告)日: | 2019-06-07 |
| 發明(設計)人: | 李德彥;席麗娜;晉耀紅 | 申請(專利權)人: | 北京神州泰岳軟件股份有限公司;中科鼎富(北京)科技發展有限公司 |
| 主分類號: | G06F16/2455 | 分類號: | G06F16/2455;G06F16/2458;G06N20/00 |
| 代理公司: | 北京弘權知識產權代理事務所(普通合伙) 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 100089 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 挖掘 規則 關聯 模型 未知 關系 方法 裝置 | ||
本申請提供一種挖掘規則關聯模型未知關聯關系的方法及裝置,該方法包括獲取規則關聯模型和至少一個樣本信息;根據規則關聯模型的所有元組中的概念,對至少一個樣本信息進行標準化處理,得到至少一個標準樣本信息;將至少一個標準樣本信息進行處理,得到每個標準樣本信息所對應的關鍵詞集;根據關鍵詞集,計算得到二元關系表達式列表;將二元關系表達式列表和規則關聯模型的候選關聯表達式列表進行匹配;根據匹配結果,建立規則關聯模型的相鄰兩個元組的概念的關聯關系。本申請可建立規則關聯模型中,未預先設置但有價值的關聯關系,使規則關聯模型全面直觀的反映實際業務場景中的有價值的關聯結果,提高定位有價值關聯結果的準確率。
技術領域
本申請涉及數據挖掘技術領域,尤其涉及一種挖掘規則關聯模型未知關聯關系的方法及裝置。
背景技術
關聯分析方法是在數據挖掘技術領域中,從一個存儲大量數據的數據庫中發掘不同數據之間的相關性的技術。關聯分析方法在選擇性行銷和決策分析等領域廣泛應用,例如,運營企業根據消費者的購物清單,利用關聯分析方法挖掘消費者通常會一起購買的商品,了解消費者的購買習慣,然后擬定有效的“捆綁銷售”行銷策略。近年來,關聯分析方法也被應用到網頁瀏覽行為分析或股市交易分析等領域。
現有的關聯分析方法大多是基于機器學習算法,如Apriori算法,其在數據庫中查采用迭代算法,找出支持度大于預置支持度的項集,也就是頻繁集,利用頻繁集構造出大于預置置信度的關聯關系,進而發現不同數據之間的相關性。
但是,現有的關聯分析方法所發現的數據之間的相關性,會因外在因素變化而失效,例如在銀行業務辦理中,某種信用卡的A型分期付款業務,比較受儲戶歡迎,但是A型分期付款業務已取消,現有的關聯分析方法還是會挖掘出這種已失效的相關性。除此之外,距離當前時間越接近的數據的相關性越重要,例如,一銀行上周推出某種信用卡的B型分期付款業務,深受儲戶歡迎,但是現有的關聯分析方法會因支持度不足而無法發現。因此,現有的關聯分析方法不能準確的定位有使用價值的關聯結果,不利于決策者制定相應的營銷策略。
發明內容
本申請提供了一種挖掘規則關聯模型未知關聯關系的方法及裝置,以解決現有的關聯分析方法不能準確的定位有使用價值的關聯結果,不利于決策者制定相應的營銷策略的問題。
第一方面,本申請提供了一種挖掘規則關聯模型未知關聯關系的方法,包括:
獲取規則關聯模型和至少一個樣本信息,所述規則關聯模型包括N個元組,N為大于1的正整數,每個所述元組包括至少一個概念;
根據所述規則關聯模型的所有元組中的概念,對所述至少一個樣本信息進行標準化處理,得到至少一個標準樣本信息;
將所述至少一個標準樣本信息進行切詞和去停用詞處理,得到每個所述標準樣本信息所對應的關鍵詞集;
根據所述關鍵詞集,按照預設算法,計算得到二元關系表達式列表;
將所述關聯表達式列表和所述規則關聯模型的候選關聯表達式列表進行匹配,所述候選關聯表達式列表是由至少一個候選關聯表達式所組成的列表,每個所述候選關聯表達式由所述規則關聯模型的兩個相鄰所述元組中未建立關聯關系的概念構成;
根據匹配結果,建立所述規則關聯模型的相鄰兩個元組的概念的關聯關系。
第二方面,本申請還提供了一種挖掘規則關聯模型未知關聯關系的裝置,包括:
獲取模塊,用于獲取規則關聯模型和至少一個樣本信息,所述規則關聯模型包括N個元組,N為大于1的正整數,每個所述元組包括至少一個概念;
標準化處理模塊,用于根據所述規則關聯模型的所有元組中的概念,對所述至少一個樣本信息進行標準化處理,得到至少一個標準樣本信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京神州泰岳軟件股份有限公司;中科鼎富(北京)科技發展有限公司,未經北京神州泰岳軟件股份有限公司;中科鼎富(北京)科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710556213.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種智能分析文檔的方法及系統
- 下一篇:一種原子化元素的錄入方法及系統





