日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種特征評價選擇方法在審

專利信息
申請號: 201210475431.4 申請日: 2012-11-21
公開(公告)號: CN103838730A 公開(公告)日: 2014-06-04
發明(設計)人: 牟向偉 申請(專利權)人: 大連靈動科技發展有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 大連東方專利代理有限責任公司 21212 代理人: 曲永祚
地址: 116023 遼寧*** 國省代碼: 遼寧;21
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 特征 評價 選擇 方法
【權利要求書】:

1.一種特征評價選擇方法,其特征在于:包括以下步驟:

A、信息增益

在信息檢索領域,研究者使用TF,DF,TFIDF來確定特征的相關性;本論文把TFIDF定義為:

TE-IDF=TF*log(NDF)]]>

其中N是語料庫中所有文章的數量;可見特征t在文章d中的TF值越大,而在語料庫所有文章中出現的次數DF越少,TFIDF的值就會越大,則可以為特征t具有很好的區分能力適合用來計算文本相似度;

信息論中的方法考慮了某一特征在不同類別文章中的分布情況;使用最多的方法是信息增益,它包括了特征在某一類別中出現和不出現這兩種情況;本文采用如下的定義式:

IG(t,c)=P(t)P(c|t)log(P(c|t)P(c))+P(t)P(c|t)log(P(c|t)P(c))]]>

其中:P(t)表示文章d包含特征t的概率;P(c|t)表示包含特征t的文章d屬于類別c的概率;表示文章d不包含特征t的概率;表示不包含特征t的文章d屬于類別c的概率;通常而言,IG(t,c)中各個事件的概率可以用其相應的頻率來估算;,條件概率P(c|t)=P(t|c)/P(t);特征t與類別c的信息增益越大,說明特征t中包含的與類別c有關的鑒別信息就越多,當然應該選擇信息增益值大的特征;

期望交叉熵只包含了特征出現在某一類別中的情況;其數學表達式如下:

CET(t,c)=P(t)P(c|t)log(P(c|t)P(c))]]>

χ2統計量方法的數學表達式如下:

S-χ2(t,c)=P(t,c)·P(t,c)-P(t,c)·P(t,c)]]>

這個概念來自聯表檢驗,它可以用來衡量特征t和類別c之間的統計相關性;在此基礎上,提出了一種更為簡化的χ2統計量,被稱為S-χ2;IG的性能要優于CET和S-χ2

B、基于雜質能級的特征評價選擇

這一類的方法來自于機器學習的領域,它們原本都是用來評價機器學習算法生成的規則質量的;為了能夠將其應用到文本相似度計算的屬性評價和選擇上,本發明要對其進行適當的修改;定義一個組合(t,c),規則是:如果文章d包含特征t,那么文章d就屬于類別c,本文用t→c來描述;這樣以來,評價特征t在類別c中的重要程度問題就轉換為衡量規則t?→c質量的問題;為了便于進行討論,本文引入如下的符號:

At,c表示屬于類別c且包含特征t的文章數量

Bt,c表示不屬于類別c且包含特征t的文章數量

Ct,c表示屬于類別c且不包含特征t的文章數量

Dt,c表示不屬于類別c且不包含特征t的文章數量

通常而言,規則質量的衡量標準是規則在應用過程中的成功率和失敗率;本發明使用最常見的拉普拉斯修正方法修改原始的成功率計算方法,把訓練成功的數量加1除以訓練實例的總數加2所得的商作為新的成功率;計算方法如下:

L(tc)=At,c+1At,c+Bt,c+2]]>

這個方法只考慮了出現特征t的文章;

其它的方法還有Johannes等人給出的一種差分法的簡化計算方法如下所述:

D(t→c)=At,c-Bt,c

它把包含特征t屬于類別的文章數量Bt,c作為包含特征t屬于類別c的文章數量At,c的懲罰而減去,目的是為了在At,c和Bt,c之間建立一種平衡;

提出了利用雜質能級的衡量方法;該方法不僅考慮到了屬于類別c且包含特征t的文章,而且還考慮了文章在所有類別的分布情況;為了討論文章的分布問題,本文引入無條件規則的概念,符號為→c,它表示屬于類別c的任意一篇文章;這個規則作為其它規則的一個參考;本文要利用規則使用的次數n和規則成功的次數m來計算規則t→c的雜質能級;已知規則t→c的成功率的前提下,可以先求出規則的置信區間:

CIl,u=2·n·p+Zα/22+Zα/2Zα/2+4·n·p-4·n·p22(n+Zα/22)]]>

其中Z是置信水平為1-α的標準正態分布的Z值;p是規則使用的成功率,如下所述:

p=mn=At,cAt,c+Bt,c]]>

因此,雜質能級就可以定義成規則t→c的置信區間和無條件規則→c的重合程度,如下公式所述:

IL(tc)=CIu(c)-CIl(tc)CIu(tc)-CIl(tc)]]>

如果雜質能級的值小于零,則說明規則t→c的成功率要高于無條件規則→c,因此要選擇雜質能級小的特征;上面的方法僅僅考慮了包含特征t的文章;如果再考慮屬于類別c但是不包含特征t的那些文章的話,應該會有助于特征的評價和選擇;本文就把這些信息添加進來,可以得到如下計算方法:

Le(tc)=At,c+1At,c+Bt,c+Ct,c+2]]>

De(t→c)=At,c-Bt,c-Ct,c

此時規則使用的成功率用公式可以描述如下:

Pe=At,cAt,c+Bt,c+Ct,c]]>

相應的置信區間如下:

CIel,u=2·n·pe+Zα/22+Zα/2Zα/2+4·n·pe-4·n·pe22(n+Zα/22)]]>

就能得到新的雜質能級,如下:

ILe(tc)=CIeu(c)-CIel(tc)CIeu(tc)-CIel(tc)]]>

還有一個局部特征集和全局的選擇問題;局部特征集由出現在某一類別文章中的特征組成,而全局特征集是由參與訓練的文章中出現的所有特征組成的;也就是說有多少個類別就會有多少個局部特征集,只會有一個全局特征集;本論文在計算所有詞條評估分數的基礎上,先從每個局部特征集抽取出一定數量的特征作為局部特征子集,再用所有的局部特征子集組合成供計算相似度使用的最終特征集。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連靈動科技發展有限公司,未經大連靈動科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210475431.4/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲高清乱码午夜电影网| 久久久综合香蕉尹人综合网| 午夜av影视| 国产不卡三区| 国产精品一区在线观看你懂的 | 午夜一区二区视频| 国产在线精品区| 久久午夜无玛鲁丝片午夜精品| 亚洲精品久久久久999中文字幕 | 欧美网站一区二区三区| 中文字幕a一二三在线| 亚洲精品97久久久babes| 国产日韩欧美第一页| 国产91高清| 99日本精品| av午夜影院| 国产理论一区二区三区| 黄色国产一区二区| 欧美一区二区三区四区夜夜大片 | 国产精品1区2区| 日本一区二区三区免费视频| 911久久香蕉国产线看观看| 国产精品久久久久久久久久久久久久不卡| 黄色91在线观看| 国产亚洲精品久久久久动| 国产白丝一区二区三区| 日韩av在线资源| 国产视频一区二区三区四区| 久久九精品| 国产欧美日韩精品一区二区图片| 久久久久亚洲| 国产精品理人伦一区二区三区| 国产欧美一二三区| 国产日本一区二区三区| 久久午夜鲁丝片| 国产一区二区在线91| 91性高湖久久久久久久久_久久99| 亚洲乱在线| 三上悠亚亚洲精品一区二区| 欧美色图视频一区| 免费毛片a| 91国产在线看| 一区二区欧美精品| 国产清纯白嫩初高生在线播放性色 | www.日本一区| 亚洲欧美制服丝腿| 日本一区二区三区电影免费观看| 午夜wwwww| 中文字幕一二三四五区| 国产精品国产三级国产专播精品人| 精品中文久久| 欧美在线一级va免费观看| 99久久国产综合精品麻豆| yy6080影院旧里番乳色吐息 | 一区二区三区国产精华| 精品国产二区三区| 亚洲国产精品区| 手机看片国产一区| 淫片免费看| 久久精品欧美一区二区| 91精品久久久久久| 最新国产精品自拍| 欧美午夜精品一区二区三区| 91精品久久天干天天天按摩| 精品国产一区二| 中文字幕一区二区三区又粗| 999久久国精品免费观看网站| 国产欧美日韩二区| 日韩国产欧美中文字幕| 99久久国产综合精品尤物酒店| 2018亚洲巨乳在线观看| 日韩区欧美久久久无人区| 欧美精品在线不卡| 国产1区2区视频| 国产精品久久91| 国内精品99| 中文字幕a一二三在线| 国产精品999久久久| 欧美一区二区三区在线免费观看| 国产精品suv一区二区6| 欧美日韩国产123| www.久久精品视频| 久久天堂国产香蕉三区| 欧美日韩一区二区三区精品| 欧美亚洲精品suv一区| 日韩免费一级视频| 91精品视频在线观看免费| 国产经典一区二区三区| 国产91免费在线| 欧美精品一区二区久久| 四虎国产永久在线精品| 国产视频在线一区二区| 日韩一区免费在线观看| 国产日产精品一区二区| 午夜理伦影院| 99爱精品视频| 欧美一区二区三区另类| 日韩精品免费播放| 国产一区二区中文字幕| 国产日韩欧美亚洲综合| 日韩久久精品一区二区| 国产亚洲综合一区二区| 欧美久久久一区二区三区| 日韩亚洲精品在线观看| 国产精品69av| 91麻豆精品国产91久久久久| 久久久久国产精品免费免费搜索| 亚洲精品乱码久久久久久高潮| 国产日韩欧美专区| 亚洲精品乱码久久久久久按摩| 日韩精品久久久久久中文字幕8| 国产激情二区| 神马久久av| 一区二区欧美精品| 高清国产一区二区| 老太脱裤子让老头玩xxxxx | 欧美精品二区三区| 国产免费一区二区三区四区五区| 久久人人爽爽| 一区二区三区四区国产| 亚洲午夜精品一区二区三区电影院| 亚洲精华国产欧美| 97人人澡人人爽91综合色| 欧美hdfree性xxxx| 久久午夜鲁丝片| 国产一区精品在线观看| 国产91麻豆视频| 少妇高潮一区二区三区99小说| 色婷婷精品久久二区二区我来| 在线视频国产一区二区| 精品久久香蕉国产线看观看gif | 亚洲欧美一二三| 在线国产精品一区| 国产一级片网站| 国产又黄又硬又湿又黄| 久久综合二区| 久久99精品国产一区二区三区| 国产乱xxxxx97国语对白| 91丝袜国产在线观看| 国产精品电影一区| 国产69精品久久| 99爱精品视频| 精品国产仑片一区二区三区| 久久97国产| 欧美亚洲精品一区二区三区| bbbbb女女女女女bbbbb国产 | 91精品国产综合久久婷婷香| 日本一二三区视频| 又黄又爽又刺激久久久久亚洲精品| 四虎国产精品永久在线国在线| 性old老妇做受| 国产亚洲精品久久久久秋霞| 激情久久久久久| 国产一a在一片一级在一片| 国产午夜精品一区| 一本色道久久综合亚洲精品浪潮| 欧美日韩中文国产一区发布| 91热国产| 91波多野结衣| 日本白嫩的18sex少妇hd| 亚洲欧美另类久久久精品2019| 国产精品网站一区| 99久久精品国产系列| 久久九九亚洲| 日韩精品一区二区三区不卡| 国产一区二区视频免费观看| 国产精品久久久久久亚洲美女高潮| 一区二区三区国产视频| 亚洲福利视频一区二区| 欧美一区二区三区免费电影| 亚洲精品国产主播一区| 国产一级片网站| 激情aⅴ欧美一区二区三区| 久草精品一区| 国产在线不卡一| 欧美日韩激情在线| 国产在线干| 狠狠色狠狠色综合久久第一次| 国产一区免费在线| 久久91精品国产91久久久| 国产精品一区在线播放| 亚洲精品www久久久久久广东| 亚洲乱视频| 亚洲乱在线| 午夜激情免费电影| 日韩午夜一区| 综合色婷婷一区二区亚洲欧美国产 | 欧美在线观看视频一区二区三区| 久久久久国产精品免费免费搜索| 色婷婷噜噜久久国产精品12p| 国产白丝一区二区三区| 欧美日韩精品影院| 欧美在线视频一区二区三区| 亚洲精品丝袜| 亚洲欧美一卡| 欧美精品久久一区二区| 欧美一区二区精品久久911| 亚洲精品少妇一区二区 | 香港日本韩国三级少妇在线观看| 黄色国产一区二区| 国产91九色视频| 日本不卡精品| 鲁丝一区二区三区免费| 91麻豆精品国产91久久久资源速度| 日韩精品乱码久久久久久| 欧美在线视频二区| 一级黄色片免费网站| 午夜爱爱电影| 亚洲少妇中文字幕| 国产乱人伦精品一区二区| 免费毛片a| 黑人巨大精品欧美黑寡妇| 99欧美精品| 国偷自产一区二区三区在线观看| 91超碰caoporm国产香蕉| xxxx在线视频| 国产在线播放一区二区| 亚洲国产精品精品| 久久久久久中文字幕 | 欧美一区二区三区免费播放视频了 | 国产精品欧美一区乱破| 国产午夜精品av一区二区麻豆 | 欧美日韩一区二区三区69堂| 国产精品视频十区| 亚洲精品日韩激情欧美| 国产91丝袜在线播放动漫| 欧美一区二区三区免费观看视频| 国产午夜一级一片免费播放| 国产一区=区| 国产色婷婷精品综合在线手机播放| 亚洲高清国产精品| 欧美在线免费观看一区| 91久久精品在线| 日韩精品久久久久久久酒店| 色一情一交一乱一区二区三区| 娇妻被又大又粗又长又硬好爽| 午夜wwww| 欧美精品一区二区久久| 久久精品麻豆| 狠狠色狠狠色综合婷婷tag| 国产一区二区三区黄| 91久久国产露脸精品国产 | 久久精品国产亚洲7777| 日韩精品中文字幕久久臀| 夜夜嗨av色一区二区不卡| 国产一区二区91|