[發明專利]提取具有意義的頻出項目集的系統、方法以及程序有效
| 申請號: | 201110216914.8 | 申請日: | 2011-07-29 |
| 公開(公告)號: | CN102456068A | 公開(公告)日: | 2012-05-16 |
| 發明(設計)人: | 吉田一星 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 于靜;楊曉光 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 提取 具有 意義 項目 系統 方法 以及 程序 | ||
1.一種方法,通過計算機的計算處理,從存儲分別包含具有一個或多個項目的項目集的多個記錄的數據庫中提取具有意義的頻出項目集,所述數據庫內的多個項目具有項目的順序,所述方法包括:
(a)決定步驟,所述計算機在與前一個被設為研究對象的項目集即舊項目集內順序最晚的項目相比順序靠后的項目存在一個以上的情況下,將所述一個以上的順序靠后的項目按降序向所述舊項目集加上一個,決定新設為研究對象的項目集即新項目集,所述舊項目集的初始值中順序為最初的空項目φ;
(b)登記步驟,所述計算機以所述新項目集的出現頻度為預定閾值以上為條件,將所述新項目集的所述出現頻度登記于所述計算機的存儲器上準備的表;
(c)判定步驟,所述計算機對向所述表的登記進行應答,使用所述表內的值判定所述新項目集內的各項目與從所述新項目集除去該項目后剩下的項目的子集之間是否具有相關關系;
(d)登記步驟,所述計算機對于所述新項目集內的所有項目的各個,以所述判定結果是肯定為條件,將所述新項目集登記于所述具有意義的頻出項目集的集合;以及
(e)重復步驟,所述計算機對向所述具有意義的頻出項目的集合的登記進行應答,將所述新項目集作為所述舊項目集基于原來的所述舊項目集決定新項目集之前,重復(a)的步驟。
2.根據權利要求1所述的方法,還包括如下步驟:在構成包含順序為第二個的項目的所述新項目集的項目的順序不連續的情況下,在步驟(c)之后,所述計算機將關于從所述新項目集除去在不連續的項目中順序最早的項目后的項目集以及從所述新項目集除去所述順序為第二個的項目后的項目集的各自的出現頻度從所述表刪除。
3.根據權利要求2所述的方法,其中,步驟(c)中的相關的判定,在將所述記錄數設為|T|,將新項目集Y的出現頻度設為|T(Y)|,將關于新項目集Y內的任意項目y的出現頻度設為|T({y})|,將從新項目集Y除去該y后剩下的項目的子集的出現頻度設為|T(Y-{y})|,將α設為比1大的預定的閾值的情況下,通過判定式|T|×|T(Y)|≥α×|T(Y-{y})|×|T({y})|是否成立進行。
4.根據權利要求2所述的方法,其中,所述表具有用于將構成項目集的項目的id的列表作為關鍵字檢索該項目集的出現頻度的映射構造。
5.根據權利要求4所述的方法,其中,所述項目的順序是從賦予各項目的1起開始的連續的正整數的id的順序。
6.一種程序,通過計算機的處理,從存儲分別包含具有一個或多個項目的項目集的多個記錄的數據庫中提取具有意義的頻出項目集,所述數據庫內的多個項目具有項目的順序,所述程序使計算機執行如下步驟:
(a)決定步驟,在與前一個被設為研究對象的項目集即舊項目集內順序最晚的項目相比順序靠后的項目存在一個以上的情況下,將所述一個以上的順序靠后的項目按降序向所述舊項目集加上一個,決定新設為研究對象的項目集即新項目集,所述舊項目集的初始值中順序為最初的空項目φ;
(b)登記步驟,以所述新項目集的出現頻度為預定閾值以上為條件,將所述新項目集的所述出現頻度登記于表;
(c)判定步驟,對向所述表的登記進行應答,使用所述表內的值判定所述新項目集內的各項目與從所述新項目集除去該項目后剩下的項目的子集之間是否具有相關關系;
(d)登記步驟,對于所述新項目集內的所有項目的各個,以所述判定結果是肯定為條件,將所述新項目集登記于所述具有意義的頻出項目集的集合;以及
(e)重復步驟,對向所述具有意義的頻出項目的集合的登記進行應答,將所述新項目集作為所述舊項目集基于原來的所述舊項目集決定新項目集之前,重復(a)的步驟。
7.根據權利要求6所述的方法,還使計算機執行如下步驟:在構成包含順序為第二個的項目的所述新項目集的項目的順序不連續的情況下,在步驟(c)之后,將關于從所述新項目集除去在不連續的項目中順序最早的項目后的項目集以及從所述新項目集除去所述順序為第二個的項目后的項目集的各自的出現頻度從所述表刪除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110216914.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:在現有靜止圖像內可視化視頻
- 下一篇:紅外感應醫療專用智能無接觸污物車





