[發明專利]一種特征評價選擇方法在審
| 申請號: | 201210475431.4 | 申請日: | 2012-11-21 |
| 公開(公告)號: | CN103838730A | 公開(公告)日: | 2014-06-04 |
| 發明(設計)人: | 牟向偉 | 申請(專利權)人: | 大連靈動科技發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 大連東方專利代理有限責任公司 21212 | 代理人: | 曲永祚 |
| 地址: | 116023 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 特征 評價 選擇 方法 | ||
技術領域
本發明涉及一種個性化商品推薦技術,特別是一種特征評價選擇方法。
背景技術
隨著信息時代的到來及互聯網革命,個人生活已經發生了翻天覆地的變化,人們開始越來越多地依賴互聯網進行購物。然而,電子商務網站上商品的數量卻以幾何爆炸的速度在增長,而且用戶的信息需求日趨多元化和個性化,不同的用戶之間存在著明顯的個性差異。要從信息海洋中迅速準備地找出自己需要的商品變得越來越困難。早期依賴于商品分類的電子商務網站已經不能滿足用戶需求。為了增加銷售、增加用戶滿意度、增加競爭力和理論研究,電子商務商品推薦系統便應運而生。它研究的主要內容是如何解決從海量的商品和信息中高效的獲得有用知識,動態的分析顧客的個性化需求,實時、主動的為顧客提供符合其偏好的商品,以及有效的提高推薦水平等問題。
傳統的個性化商品推薦技術多種多樣。但是都只適用于特定的情況:基于內容的推薦技術只需要特定用戶的數據而不需要其它用戶的數據,但是在用戶的偏好發生變化的情況下不能適用;協同過濾推薦技術使用最近鄰技術,根據其他用戶與當前用戶之間的距離,利用其他用戶對商品的評價來預測目標用戶對特定商品的喜好程度,但要求數據量比較大才好;基于效用和基于知識的推薦技術都著眼于為每個用戶創建一個效用函數或者效用知識從而為目標用戶來推薦商品,但是基于效用的技術很大程度上依賴于效用函數的選擇,效果太不穩定;基于用戶統計信息的推薦方法首先對用戶的個人屬性進行分類,然后根據用戶分類的不同進行推薦。但事實上用戶的信息統計資料是很難得到的。基于關聯規則的推薦沒有上述技術的那些局限。它可以依靠網站原有的記錄為用戶提供推薦,而且這些推薦不但可以滿足用戶的個性化偏好,還可以在一定程度上預測用戶的購買行為。但是,由于關聯規則沒有考慮規則中各個項的先后次序,而用戶訪問網站的時候是有嚴格的先后次序的,因此基于關聯規則的推薦技術是存在一定的不足。
發明內容
為解決現有技術存在的上述問題,本發明要設計一種允許服務對象按照需要設定知識規則、可以提供大部分領域信息系統的個性化服務并可以推薦出新的服務對象感興趣資源的互聯網的個性化服務方法。
為了實現上述目的,本發明的技術方案如下:一種特征評價選擇方法,包括以下步驟:
A、信息增益
在信息檢索領域,研究者使用TF,DF,TFIDF來確定特征的相關性。本論文把TFIDF定義為:
其中N是語料庫中所有文章的數量。可見特征t在文章d中的TF值越大,而在語料庫所有文章中出現的次數DF越少,TFIDF的值就會越大,則可以為特征t具有很好的區分能力適合用來計算文本相似度。
信息論中的方法考慮了某一特征在不同類別文章中的分布情況。使用最多的方法是信息增益(Information?gain,IG),它包括了特征在某一類別中出現和不出現這兩種情況。本文采用如下的定義式:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連靈動科技發展有限公司,未經大連靈動科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210475431.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:行車激光糾偏裝置
- 下一篇:鐵路貨車通用型固定牽引桿





