[發明專利]一種基于相似變精度粗糙集模型的知識推送規則提取方法在審
| 申請號: | 201710290504.5 | 申請日: | 2017-04-28 |
| 公開(公告)號: | CN107169059A | 公開(公告)日: | 2017-09-15 |
| 發明(設計)人: | 張發平;李麗;張清雅;吳迪;張曉剛;敬石開 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京理工正陽知識產權代理事務所(普通合伙)11639 | 代理人: | 毛燕 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 相似 精度 粗糙 模型 知識 推送 規則 提取 方法 | ||
技術領域
本發明涉及一種基于相似變精度粗糙集模型的知識推送規則提取方法,屬于知識工程領域。
背景技術
知識推送技術是在適當的時間,將適當的知識推送給適當的人,旨在降低知識獲取成本,提高知識獲取效率。知識推送的依據主要是知識產生、應用的情境條件,結合知識的推送規則,判斷當前用戶需要的知識,并將這些知識推送給用戶。知識推送規則的提取是研究知識推送的一個重點問題。
粗糙集作為一種用于處理不確定信息與知識的數據分析理論,在機器學習、知識發現領域得到了廣泛且成功的應用。將粗糙集的理論應用于知識規則提取,可以從知識的使用記錄中找出情境信息與知識信息之間的關聯,歸納出知識推送的規則。在應用時,必須解決的問題是經典粗糙集模型的過于嚴格,缺乏容錯能力的問題。
發明內容
針對知識推送中的知識規則提取過程中的經典粗糙集模型存在的下述問題:經典粗糙集模型過于嚴格、缺乏容錯能力、不適于知識推送規則提取情境。本發明公開的一種基于相似變精度粗糙集模型的知識推送規則提取方法能夠解決粗糙集模型過于嚴格的問題、提高粗糙集模型的容錯能力、使其適于知識推送規則提取情境,此外,本發明能夠獲取高質量的知識推送規則,提高知識推送精度,降低知識獲取成本,提高知識獲取效率。
本發明的目的是通過下述技術方案實現的。
首先說明必要的定義。
定義1知識推送的決策信息系統。
知識推送的決策信息系統表示為有序四元組S={U,R,V,f}。
其中,U={u1,u2,…,un}表示的是用戶操作記錄集合,其中的每個元素記錄了在特定的用戶情境下用戶查看和使用知識的行為記錄;
R=C∪D為屬性集合,其中子集C是條件屬性集合,反映的是用戶情境的特征屬性,D為決策屬性集合,反映的是用戶查看、使用的知識特征屬性;
V=∪Vr為屬性值的集合,r∈R,Vr表示屬性r的取值范圍,考慮到情境和知識特征屬性描述的多樣性和復雜性,屬性值的一般類型有數值型、向量型、字符型、模糊型,因此V是多種類型屬性取值范圍的集合;
f:U×R→V為一個信息函數,用于確定U中每一個對象u的屬性值,即任一ui∈U,r∈R,則f(ui,r)=Vr。
定義2引入相似關系的不可分辨關系。
在信息系統S={U,R,V,f}中,對于ui,uj∈U,在任意屬性子集B上的相似度為SB(ui,uj),其中
SB(ui,uj)=∑(wk*sB(ui,uj,rk))其中sB(ui,uj,rk)表示ui,uj在B中第k個屬性rk上的相似度,屬性類型不同則屬性的相似度計算方式不同。考慮到特征屬性重要程度的差異,wk表示第k個屬性的重要程度,可采取專家打分法、調查統計法、層次分析法確定。
基于相似度SB(ui,uj)對對象U進行聚類,聚類之后的每一類為一個等價類,同一類中的元素之間為不可分辨關系,又稱等價關系,記在屬性子集B上的等價關系為Ind(B)。根據條件屬性和決策屬性分別進行聚類,即根據情境屬性相似度SC和知識屬性相似度SD分別進行聚類。基于條件集合C的等價類稱為條件類,記為Xi,基于決策集合D的等價類稱為決策類,記為Yj。
定義3變精度粗糙集模型及其正、負域。
為了增強經典粗糙集模型的容錯能力,減少外界噪音對模型的影響,將概率理論引入粗糙集模型中,提出變精度粗糙集模型時,引入一對概率閾值(α,β),設0≤β<α≤1。
正域定義為:POS(α,β)(X)={u∈U|Pr(X|[u]B)≥α};
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710290504.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種試題打亂順序方法和系統
- 下一篇:終端中的圖片處理方法、裝置及終端





