日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于類內類間文檔頻和詞頻統計的特征選擇方法在審

專利信息
申請號: 201810131876.8 申請日: 2018-02-09
公開(公告)號: CN108491429A 公開(公告)日: 2018-09-04
發明(設計)人: 邵雄凱;趙婧;劉建舟;王春枝;華滿;陽鄒;陳亮亮 申請(專利權)人: 湖北工業大學
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 代理人: 魏波
地址: 430068 湖北*** 國省代碼: 湖北;42
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文檔 特征選擇 詞頻統計 特征詞 訓練集 詞庫 評估函數 原始特征空間 詞頻 文本預處理 集中分布 中文文本 綜合考慮 分散度 集中度 并集 分類
【說明書】:

發明公開了一種基于類內類間文檔頻和詞頻統計的特征選擇方法,綜合考慮特征詞的文檔頻、詞頻以及特征詞的類間集中度、類內分散度,構造出基于類內類間文檔頻和詞頻統計(DFCTFS)的特征選擇評估函數;將訓練集經過文本預處理后的原始特征空間使用本發明提出的特征選擇評估函數在訓練集每個類別中選取一定比例的特征詞組成該類別的特征詞庫,而訓練集的特征詞庫則為訓練集各類別特征詞庫的并集。本發明提出一種基于類內類間文檔頻和詞頻統計(DFCTFS)的特征選擇方法,可實現特征選擇出集中分布于某類文檔并在該類文檔中均勻分布且頻繁出現的特征詞,提高中文文本分類的效果。

技術領域

本發明屬于中文文本分類技術領域,涉及一種特征選擇方法,具體涉及一種基于類內類間文檔頻和詞頻統計的特征選擇方法。

背景技術

中文文本分類整體思路大致為:文本預處理,特征選擇,建立文本表示模型,使用分類算法分類,分類模型評估。特征選擇是中文文本分類的關鍵步驟,它是指從高維的原始特征空間中選擇一部分重要特征,組成一個低維空間,從而提高分類精度和分類效率。

傳統的特征選擇方法有:文檔頻率(DF)、互信息(MI)、信息增益(IG)、卡方統計量(CHI)等。特征選擇的做法一般是選用一個評估函數對原始的n個特征項進行計算,對計算所得的值按降序排列,從原始特征項集合中選出含信息量較多的前P個特征項。

傳統的特征選擇方法中CHI和IG被證明是文本分類效果較好的兩種特征選擇方法。CHI以特征詞t與類別Ci相互獨立為前提,計算這兩個變量之間的值(即偏差程度),如果計算得到的值越大(即偏差較大),則特征詞t與類別Ci越相關。但是,傳統的CHI方法存在著不足,(1)未考慮特征詞在各類別中的詞頻分布,只考慮了特征詞的文檔頻,導致CHI可能會選擇文檔頻率高但詞頻低的特征詞。(2)可能會選擇與類別負相關的特征詞。

IG用于文本的特征選擇時,衡量的是某個詞的出現與否對判斷一個文本是否屬于該類所提供的信息量,信息量的多少由熵來衡量。IG即為不考慮任何特征時文檔的熵和考慮該特征后文檔的熵的差值,該差值表示信息不確定性的減少程度。信息不確定性減少程度越大,相應的信息增益越大,該詞項提供的信息越多,該詞項越重要。但是,傳統的IG方法存在著不足,(1)未考慮特征詞在各類別中的詞頻分布;(2)特征詞負相關性的干擾;(3)只能做全局的特征選擇(指訓練集中所有類別都使用相同的特征集合),而無法做本地的特征選擇(指訓練集中每個類別都有自己的特征集合)。

訓練集通過預處理和特征選擇后形成特征詞庫。CHI特征選擇方法是依據CHI評估函數,得到各特征詞在訓練集各個類別的CHI值,使用特征詞在所有類別中的CHI值的平均值或者最大值作為該特征詞在整個訓練集中的CHI值,將所有特征詞按CHI值降序排列,選取一定比例的特征詞作為整個訓練集的特征詞庫。IG特征選擇方法是依據IG評估函數,得到各特征詞在整個訓練集中的IG值,將所有特征詞按IG值降序排列,選取一定比例的特征詞作為整個訓練集的特征詞庫。

綜合分析CHI和IG的不足,可以得出,文本分類中的特征選擇關鍵在于選擇出集中分布于某類文檔并在該類文檔中均勻分布且頻繁出現的特征詞。因此,本發明綜合考慮特征詞的文檔頻、詞頻以及特征詞的類間集中度、類內分散度,提出一種基于類內類間文檔頻和詞頻統計(Document Frequency of within-class and between-class and TermFrequency Statistics,DFCTFS)的特征選擇方法,提高分類的精度。

發明內容

本發明的目的在于提供一種基于類內類間文檔頻和詞頻統計的特征選擇方法,優化特征選擇的結果,提高中文文本分類的精度。

本發明所采用的技術方案是:1.一種基于類內類間文檔頻和詞頻統計的特征選擇方法,其特征在于,包括以下步驟:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北工業大學,未經湖北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810131876.8/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 99精品欧美一区二区| 国产精品96久久久久久久| 少妇高清精品毛片在线视频| 午夜情所理论片| 91久久国产露脸精品国产| 国产伦精品一区二区三区照片91| 日本一二三不卡| 久久精品一二三四| 综合久久国产九一剧情麻豆| 国产精品免费一视频区二区三区| 国产一级片网站| 日韩区欧美久久久无人区| 午夜特级片| 99国产精品免费| 国产69精品久久久久777糖心| 国产色婷婷精品综合在线播放| 国产人澡人澡澡澡人碰视| 国产v亚洲v日韩v欧美v片| freexxxxxxx| 久久国产欧美日韩精品| 99久久国产免费| 欧美一区二区三区免费看| 99日本精品| 亚洲乱亚洲乱妇28p| 亚洲精品日韩精品| 午夜亚洲影院| 91亚洲精品国偷拍自产| 久久国产精品精品国产| 免费毛片**| 免费毛片a| 欧美日韩亚洲国产一区| 精品久久小视频| 亚洲欧洲日韩在线| 亚洲无人区码一码二码三码| 国产一区二区综合| 国产在线拍偷自揄拍视频 | 97香蕉久久国产超碰青草软件| 国产一区二区91| 亚洲国产另类久久久精品性| 国产一卡在线| 国产一区在线精品| 国产精品天堂网| 免费看片一区二区三区| 亚洲国产日韩综合久久精品| 午夜影院啪啪| 99精品视频一区二区| 国产欧美一区二区三区视频| 日本二区在线观看| 亚洲欧美日韩国产综合精品二区| 国产主播啪啪| 欧美一区二区三区在线免费观看| 91精品国产综合久久国产大片| 91精品综合在线观看| 久久久精品a| 97精品国产97久久久久久| 国产精品一区不卡| 国产精品一区二区av麻豆| 午夜电影天堂| 国产精品偷乱一区二区三区| 国产精品第157页| 国产精品区一区二区三| 日本边做饭边被躁bd在线看 | 欧美在线视频一二三区| 欧美一区二区三区免费电影| yy6080影院旧里番乳色吐息| 国产精品免费专区| 91精品一二区| 97久久精品人人做人人爽| 欧美高清性xxxx| 在线观看欧美日韩国产| 久久精品国产久精国产| 国产一区二区精品在线| 亚洲日韩欧美综合| 欧美日韩激情在线| 99国产精品久久久久99打野战| 欧美hdfree性xxxx| 久久99中文字幕| 97久久超碰国产精品| 精品一区电影国产| 少妇中文字幕乱码亚洲影视| 亚洲在线久久| 羞羞视频网站免费| 国产一区二区三区精品在线| 91亚洲欧美强伦三区麻豆| 91国产一区二区| 国产精品视频1区| 91麻豆精品国产91久久久久| 性色av色香蕉一区二区| 国产精品麻豆一区二区| 欧美在线视频三区| 四虎国产精品永久在线| 久久精视频| 午夜天堂电影| 少妇在线看www| 午夜影院啪啪| 久久99精品久久久秒播| 亚洲国产视频一区二区三区| 亚洲少妇一区二区三区| 538在线一区二区精品国产| 国产欧美日韩二区| 国产在线卡一卡二| 国产三级在线视频一区二区三区| 大伊人av| 国产精品入口麻豆九色| 夜夜躁日日躁狠狠久久av| 性国产日韩欧美一区二区在线| 久久国产精彩视频| 国产999在线观看| 91九色精品| 久久久久国产精品免费免费搜索| 亚洲一二三四区| 首页亚洲欧美制服丝腿| 国产一级一区二区| av国产精品毛片一区二区小说| 国内久久精品视频| 欧美精品中文字幕亚洲专区| 四虎国产精品久久| 性欧美1819sex性高播放| 91一区二区三区久久国产乱| 91狠狠操| 91精品视频在线免费观看| 久久影视一区二区| 91久久精品久久国产性色也91| 99精品国产一区二区三区麻豆 | 久久99精品国产一区二区三区| 91亚洲精品国偷拍| 玖玖玖国产精品| 国产无遮挡又黄又爽又色视频| 欧美一区二区三区四区夜夜大片 | 99日韩精品视频| 亚洲精品国产setv| 老太脱裤子让老头玩xxxxx | 91社区国产高清| 亚洲福利视频一区| 欧美片一区二区| 亚洲美女在线一区| 国产亚洲精品久久久久秋霞| 99久热精品| 97久久精品人人做人人爽50路| 91国偷自产一区二区介绍| 欧美777精品久久久久网| 午夜大片男女免费观看爽爽爽尤物| 亚洲一二三在线| 精品久久久久一区二区| 91福利视频免费观看| 欧美精品九九| 久久免费视频一区二区| 国产一级不卡毛片| 国产一区日韩欧美| 国产91精品一区二区麻豆亚洲| 国产一区三区四区| 99国产精品久久久久99打野战| 国产欧美日韩精品一区二区图片| 国产伦精品一区二区三区电影| 性刺激久久久久久久久九色| 精品香蕉一区二区三区| 亚洲欧美一区二区三区三高潮| 国产淫片免费看| 国产亚洲欧美日韩电影网| 男女无遮挡xx00动态图120秒| 中文在线√天堂| 91麻豆精品一区二区三区| 亚洲精品中文字幕乱码三区91| 国产69精品久久久| 国产精品综合在线| 99爱国产精品| 欧美日韩精品不卡一区二区三区 | 99riav3国产精品视频| 国产精品69久久久| ass韩国白嫩pics| 国产日韩欧美另类| 国产一区正在播放| 国产第一区二区三区| 国产乱色国产精品播放视频| 日韩无遮挡免费视频| 一本色道久久综合亚洲精品浪潮| 国产欧美一二三区| 538在线一区二区精品国产| 欧美日韩国产精品一区二区亚洲| 中文丰满岳乱妇在线观看| 精品国产乱码一区二区三区a| 国产91麻豆视频| 国产男女乱淫视频高清免费 | 亚洲乱亚洲乱妇28p| 国产一级在线免费观看| 美女直播一区二区三区| 国产伦精品一区二区三区四区| 中文字幕一区二区三区免费视频| 二区三区视频| 亚洲伊人久久影院| 日韩一区免费| 欧美极品少妇xxxxⅹ| 亚洲欧洲日韩| 亚洲欧美国产日韩色伦| 狠狠色狠狠色综合系列| 国产精品5区| 99精品黄色| 高清国产一区二区 | 91麻豆产精品久久久| 久久久精品欧美一区二区免费| 99国产精品9| 精品无码久久久久国产| 色狠狠色狠狠综合| 欧美乱大交xxxxx胶衣| 国产一区二区中文字幕| 日韩久久精品一区二区| 日韩av在线电影网| 91看片淫黄大片91| 国产午夜精品一区理论片飘花| 岛国精品一区二区| 97久久超碰国产精品红杏| 国产伦精品一区二区三| 午夜av片| 亚洲欧美色图在线| 国产一级在线免费观看| 午夜剧场一区| sb少妇高潮二区久久久久| 中文字幕理伦片免费看| 狠狠色噜噜狼狼狼色综合久| 91性高湖久久久久久久久_久久99| 日韩av免费电影| 国产欧美一区二区三区免费看| 国产精品一二三在线观看| 午夜毛片影院| 国产精品乱综合在线| 中文字幕国内精品| 国产一区欧美一区| 亚日韩精品| ass美女的沟沟pics| 亚洲精品一区中文字幕| 欧美日韩一区二区三区不卡| 精品国产区一区二| 一区二区三区日韩精品| 久久综合国产伦精品免费| 国产一区观看| 国产日韩欧美亚洲综合| 国产一区二区精品在线| 国产91在线播放| 性生交大片免费看潘金莲| 狠狠躁夜夜| 91一区在线| 亚日韩精品| 国产一级不卡视频| 91精品资源| 亚洲一级中文字幕| 国产99久久久久久免费看|