日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于文檔層詞頻重排序的特征選擇方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 201810820200.X 申請(qǐng)日: 2018-07-24
公開(kāi)(公告)號(hào): CN109376235B 公開(kāi)(公告)日: 2021-11-16
發(fā)明(設(shè)計(jì))人: 周紅芳;張英杰;劉虹江;張堯;張懿輝;吳珞風(fēng) 申請(qǐng)(專利權(quán))人: 西安理工大學(xué)
主分類號(hào): G06F16/35 分類號(hào): G06F16/35
代理公司: 西安弘理專利事務(wù)所 61214 代理人: 談耀文
地址: 710048*** 國(guó)省代碼: 陜西;61
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 基于 文檔 詞頻 排序 特征 選擇 方法
【說(shuō)明書】:

本發(fā)明公開(kāi)了一種基于文檔層詞頻重排序的特征選擇方法。它的主要目的是為了降低特征空間的維度,提高分類的精度。首先基于現(xiàn)有數(shù)據(jù)集,去除那些冗余的、信息量特別少的特征,然后依據(jù)特征選擇方法進(jìn)行數(shù)據(jù)集的降維處理,最后基于當(dāng)前特征集合,通過(guò)5折交叉驗(yàn)證的方法,構(gòu)建分類模型并得出分類F1值,選取對(duì)應(yīng)分類F1值最高的特征集作為最優(yōu)特征集。本發(fā)明專利技術(shù)的方法用于特征選擇,幫助發(fā)現(xiàn)具有區(qū)分能力的詞條信息,并且通過(guò)詞條頻率在文檔層上的重排序方法來(lái)克服文檔頻率計(jì)算方式的單一性問(wèn)題和數(shù)據(jù)集的非平衡性問(wèn)題。

技術(shù)領(lǐng)域

本發(fā)明屬于數(shù)據(jù)挖掘方法技術(shù)領(lǐng)域,涉及一種基于文檔層詞頻重排序的特征選擇方法。

背景技術(shù)

隨著互聯(lián)網(wǎng)的不斷發(fā)展,科學(xué)知識(shí)、互聯(lián)網(wǎng)數(shù)據(jù)以及各種資源呈現(xiàn)出海量的特點(diǎn)。數(shù)據(jù)處理與數(shù)據(jù)存儲(chǔ)技術(shù)不斷提高,也使網(wǎng)絡(luò)中文檔數(shù)量不斷地呈指數(shù)級(jí)增長(zhǎng),如何從海量信息中快速、準(zhǔn)確的獲取有價(jià)值的信息成為人們迫切需要解決的難題。手動(dòng)處理數(shù)據(jù)的能力已遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)實(shí)生活的要求,有效地組織和管理信息,快速地區(qū)分有用和無(wú)用信息,都面臨著巨大的挑戰(zhàn)。分類技術(shù)成為解決這一問(wèn)題的關(guān)鍵技術(shù),并且被廣泛應(yīng)用到不同場(chǎng)景,如信息過(guò)濾、信息檢索、搜索引擎、詞義辨析、郵件分類、數(shù)字圖書館、文本語(yǔ)料庫(kù)構(gòu)建等。在信息科學(xué)領(lǐng)域中,它是指計(jì)算機(jī)按照一定標(biāo)準(zhǔn)或類別體系對(duì)數(shù)據(jù)集進(jìn)行自動(dòng)類別劃分的過(guò)程。

分類技術(shù)可分為數(shù)據(jù)集預(yù)處理、特征選擇、分類算法、性能評(píng)估等多個(gè)階段。因?yàn)樵诜诸惖奶幚磉^(guò)程中必然出現(xiàn)“高維度”的問(wèn)題,在分類器的運(yùn)行時(shí)間和準(zhǔn)確性方面,高維數(shù)據(jù)會(huì)使其分類性能大大降低。因此特征選擇作為一種常見(jiàn)的降維方法已成為信息分類的關(guān)鍵技術(shù)。特征選擇指的是從原始特征空間中選擇出具有較強(qiáng)的類別區(qū)分能力的特征項(xiàng),依據(jù)某一種或某些評(píng)價(jià)標(biāo)準(zhǔn)對(duì)特征全集進(jìn)行降維處理,生成較低維度的特征子集,并且在很多方面它已經(jīng)展現(xiàn)出了實(shí)際應(yīng)用價(jià)值。

目前,常見(jiàn)的特征選擇方法有文檔頻率(DF)、歸一化差值測(cè)量方法(NDM)、平衡精度(ACC2)、卡方檢驗(yàn)(CHI)、優(yōu)勢(shì)率(OR)和基尼系數(shù)(GINI)等。這些方法在理論上是合理的,但應(yīng)用于分類時(shí),效果卻有所不同。通過(guò)研究發(fā)現(xiàn),這些方法以不同的衡量標(biāo)準(zhǔn)對(duì)特征詞進(jìn)行排序,NDM和ACC2使用真正率和假正率來(lái)進(jìn)行計(jì)算;CHI是以x2分布為基礎(chǔ)的假設(shè)檢驗(yàn)方法;OR是使用事件發(fā)生的概率與事件不發(fā)生的概率的比率來(lái)表示特征詞的重要度;GINI是一種非純度的屬性分裂方法。我們發(fā)現(xiàn),它們都是通過(guò)統(tǒng)計(jì)不同情況下對(duì)應(yīng)的文檔數(shù)來(lái)進(jìn)行計(jì)算的,盡可能全面的使用詞條正負(fù)類之間的文檔頻率進(jìn)行特征排序,生成特征子集。

通過(guò)對(duì)常見(jiàn)特征選擇方法的研究,從頻率的角度考慮,雖然大多數(shù)特征選擇算法都充分使用了文檔頻率,但是忽略了詞條頻率對(duì)其的影響,沒(méi)有綜合考慮文檔頻率和詞頻兩者之間的相互影響;從類別信息角度考慮,很多方法都偏向平衡數(shù)據(jù)集,但在實(shí)際問(wèn)題中,很多數(shù)據(jù)集是不平衡的。因此,需要提出一種以詞頻和文檔頻率結(jié)合的方式進(jìn)行特征選擇的方法,以提高文本分類的準(zhǔn)確率。

發(fā)明內(nèi)容

本發(fā)明的目的是提供一種基于文檔層詞頻重排序的特征選擇方法,解決現(xiàn)有技術(shù)存在的分類精度較低的問(wèn)題。

本發(fā)明采用技術(shù)方案是,一種基于文檔層詞頻重排序的特征選擇方法的具體操作步驟如下:

步驟1:獲取已經(jīng)進(jìn)行了詞干提取和去停用詞處理的WAP、RE0、RE1、 K1a、K1b、20Newsgroups這六種數(shù)據(jù)集,消除數(shù)據(jù)集中頻繁出現(xiàn)和幾乎不出現(xiàn)的詞條,另外,采用5折交叉驗(yàn)證法劃分測(cè)試集和訓(xùn)練集;

步驟2:使用基于文檔層詞頻重排序的特征選擇方法,設(shè)置特征詞個(gè)數(shù),生成最優(yōu)特征子集;

步驟3:使用樸素貝葉斯分類器和支持向量機(jī)分類器對(duì)最優(yōu)特征子集依次進(jìn)行訓(xùn)練和分類,訓(xùn)練出分類器的模型,得到分類結(jié)果;

本發(fā)明的特點(diǎn)還在于,

步驟1頻繁出現(xiàn)的詞條是指詞條出現(xiàn)的文檔頻率超過(guò)25%的詞條。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安理工大學(xué),未經(jīng)西安理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810820200.X/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产精品一二三区视频网站| 销魂美女一区二区| 国产69精品久久久久久野外| 欧美一区二区三区久久久久久桃花| 欧美在线视频一区二区三区| 玖玖精品国产| 欧美日韩中文字幕一区二区三区| 17c国产精品一区二区 | 国产亚洲精品久久久久秋霞| 97精品超碰一区二区三区| 欧美高清性xxxx| 欧美一区二区伦理片| 国产日韩欧美色图| 亚洲一级中文字幕| 99精品国产一区二区三区麻豆| 97欧美精品| 欧美在线视频二区| 国产精品免费一视频区二区三区| 亚洲精品一品区二品区三品区 | 国产女人与拘做受免费视频| 欧美乱码精品一区二区| 久久亚洲精品国产一区最新章节| 国产精品视频一区二区在线观看| 久久精品国产久精国产| 99日本精品| 亚洲欧美日本一区二区三区| 国产偷亚洲偷欧美偷精品 | 午夜影皖精品av在线播放| 91丝袜国产在线观看| 思思久久96热在精品国产| 亚洲欧美日韩精品suv| 国产欧美精品va在线观看| 91超碰caoporm国产香蕉| 国产精品日韩视频| 欧美一区二区三区视频在线观看| 国产69精品久久久久按摩| 亚洲四区在线观看| 午夜免费片| 国产精品麻豆99久久久久久| 久久综合久久自在自线精品自| 午夜亚洲国产理论片一二三四| 国产伦精品一区二区三| 国产97久久| 国产1区2区视频| 亚洲欧美一区二| 国产精品爽到爆呻吟高潮不挺| 久久福利免费视频| 国产精品久久久久久久久久久久久久久久久久| 久久精品视频一区二区| 狠狠躁夜夜躁人人爽天天天天97| 午夜电影天堂| 69精品久久| 日韩精品中文字幕一区| 国产一卡二卡在线播放| 欧美一区二区三区白人| 午夜av在线电影| 国产日韩欧美一区二区在线观看| 国产精品国精产品一二三区| 韩日av一区二区三区| 一区二区三区国产精华| 一区二区欧美精品| 国产一区日韩在线| 国产一区二区国产| 91精品国产一区二区三区| 精品少妇一区二区三区免费观看焕| 国产精品女人精品久久久天天| 91精品久| 国产日韩精品一区二区三区| 国产精品999久久久| 国产高潮国产高潮久久久91| 亚洲高清毛片一区二区| 日韩一级片免费视频| 精品久久久久久中文字幕| 久久夜色精品国产亚洲| 少妇高潮在线观看| 国产高清在线一区| 最新国产一区二区| 97欧美精品| yy6080影院旧里番乳色吐息 | 亚洲精品国产综合| 国产精品视频一区二区在线观看 | 欧美精品一区久久| 日本一区二区高清| 国语对白一区二区| 日本白嫩的18sex少妇hd| 日韩精品1区2区3区| 狠狠躁夜夜av| 香蕉视频在线观看一区二区| 91国产一区二区| 色吊丝av中文字幕| 天摸夜夜添久久精品亚洲人成| 欧美一区二区久久| 久久精品综合| 国产伦精品一区二区三区四区| 国产精品你懂的在线| 亚洲精品国产主播一区| 日本一区二区在线电影| 精品国产一区二区三区忘忧草| 国产精品电影免费观看| 国产日韩欧美精品一区二区| 99精品欧美一区二区三区美图| 亚洲va欧美va国产综合先锋| 国产精品综合在线| 午夜伦全在线观看| 最新国产精品久久精品| sb少妇高潮二区久久久久| 欧美髙清性xxxxhdvid| 国产精品麻豆一区二区三区| 欧美日韩九区| 91视频国产九色| 久久精品二| 欧美日韩国产色综合视频| 国产精品国产三级国产专区51区| 久久九精品| 国产精品一区二区6| 99爱精品在线| 日韩av一区不卡| 日韩中文字幕区一区有砖一区| 欧美极品少妇xx高潮| 精品欧美一区二区在线观看| 黄毛片在线观看| 国产欧美视频一区二区三区| 亚洲精品国产主播一区| 国产欧美日韩精品一区二区三区 | 亚洲精品国产综合| 91精品www| 国产精品乱码一区二区三区四川人| 97视频一区| 麻豆国产一区二区三区| 亚洲一区二区三区加勒比| 国产乱了高清露脸对白| 国产精品一区二区av麻豆| 精品一区二区三区视频?| 国产伦精品一区二区三区四区| 久久精品二| 国产精品久久久久久久龚玥菲| 在线观看欧美日韩国产| 欧美一区二区三区在线视频播放| 99久久国产综合精品尤物酒店| 色综合久久久久久久粉嫩| 国产高清一区在线观看| 一区精品二区国产| 欧美日韩一区二区三区精品| 久久一级精品视频| 99精品欧美一区二区| 国产一级片一区| 国产日韩精品一区二区| 国产精品5区| 国产女人和拘做受在线视频| 欧美一区二区三区精品免费| 久久黄色精品视频| 国产999精品久久久久久绿帽| 99爱精品在线| 日本一区免费视频| 中文字幕在线乱码不卡二区区| 少妇自拍一区| 日韩午夜一区| 欧美一区二区三区三州| 欧美日韩久久一区二区| 午夜av男人的天堂| 日韩欧美精品一区二区| 精品少妇一区二区三区 | 国产精品自产拍在线观看桃花| 91精品啪在线观看国产手机| 日本一区二区免费电影| 精品a在线| 欧洲国产一区| 国产乱老一区视频| 亚洲码在线| 午夜欧美影院| 欧美网站一区二区三区| 欧美日韩一区二区三区精品| 日韩一区二区精品| 日韩久久电影| 狠狠色噜噜狠狠狠狠米奇777| 久精品国产| 国产精品久久久久久久四虎电影| 欧美精品免费视频| 国产电影精品一区| 欧美一区免费| 欧美在线一区二区视频| 国产精品尤物麻豆一区二区三区| 麻豆国产一区二区三区| 国产精品欧美久久久久一区二区| 视频一区二区国产| 狠狠色噜噜狠狠狠狠777| 欧美精品综合视频| 国产精品免费一视频区二区三区| 亚洲精品国产suv| 亚洲国产精品一区在线| 午夜影院黄色片| 奇米色欧美一区二区三区| 狠狠色综合久久丁香婷婷 | 午夜激情在线播放| 免费超级乱淫视频播放| 日韩a一级欧美一级在线播放| 亚洲国产精品女主播| 日韩精品午夜视频| 国产丝袜一区二区三区免费视频 | 精品999久久久| 亚洲女人av久久天堂| 亚洲欧美日韩综合在线| 韩日av一区二区三区| 久久久久久久亚洲国产精品87| 91夜夜夜| 国产视频二区在线观看| 狠狠色噜噜综合社区| 久久免费视频一区二区| 亚洲欧美一卡| 精品久久综合1区2区3区激情 | 欧美一区二区三区艳史| 日韩一区免费| 亚洲精品中文字幕乱码三区91| 久久人做人爽一区二区三区小说| 日本精品视频一区二区三区| 高清在线一区二区| 午夜天堂电影| 欧美极品少妇xxxxⅹ| 香港三日三级少妇三级99| 蜜臀久久99精品久久久久久网站| 日韩区欧美久久久无人区| 亚洲国产欧美一区二区三区丁香婷| 国产精品久久久视频| 日本一区免费视频| 亚洲高清国产精品| 欧美网站一区二区三区| 国产精品久久久久久久久久久久久久不卡 | 久久艹国产精品| 狠狠色狠狠色88综合日日91| 91久久国语露脸精品国产高跟| 欧美日韩一区二区三区在线播放 | 国产一区二区手机在线观看| 亚洲免费精品一区二区| 91精品色| 国产精品久久久爽爽爽麻豆色哟哟 | 欧美日韩国产精品一区二区三区| 亚洲精品卡一卡二| 国产日韩欧美精品| 国产偷窥片| 日本一区二区三区在线视频| 国产欧美视频一区二区三区| 日韩精品中文字幕一区二区三区| 欧美日韩中文字幕一区二区三区| 99久久www免费| 91精品一区在线观看| 国产欧美日韩精品一区二区三区 |