日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于信息熵特征權重量化的海量短文本分布式KNN分類算法及系統有效

專利信息
申請號: 201410150855.2 申請日: 2014-04-15
公開(公告)號: CN103955489B 公開(公告)日: 2017-09-22
發明(設計)人: 蔡毅;蔡志威;王濤 申請(專利權)人: 華南理工大學
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 廣州市華學知識產權代理有限公司44245 代理人: 蔡茂略
地址: 510640 廣*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 信息 特征 權重 量化 海量 短文 分布式 knn 分類 算法 系統
【權利要求書】:

1.基于信息熵特征權重量化的海量短文本分布式KNN分類方法,其特征在于,包括下述步驟:

S1、通過信息熵指標衡量特征在數據集中的分布確定性,將確定性高的特征賦予高權重,反之賦予低權重,得到反映類分布的權重量化方法;

面向類分布均勻數據、基于熵的特征權重量化子方法的具體步驟為:

S111、初始化特征——類別分布矩陣,統計每個特征t在各個類ci中出現詞頻f(t,ci);

S112、計算每個類別ci的詞頻總數f(ci)=∑tf(t,ci);

S113、計算特征在訓練數據集中的熵值:

Entropy(t)=Σi=0np(t,ci)log(p(t,ci))]]>

其中p(t,ci)=f(t,ci)/f(ci),n為類別的總數目;

S114、采用邏輯斯蒂方程計算特征的分類貢獻度:

weight(t)=11+eentropy(t)-threshold]]>

其中,threshold是歸一化閾值;

面向非均勻類分布數據、基于平衡熵的特征權重量化子方法,考慮到類之間文檔數量的不平衡性,在一個樣本數極少的類中出現一次和在一個樣本數較多的類中出現一次應該給予不同的權重,包括以下步驟:

S121、初始化特征-類別分布矩陣,統計每個特征t在各個類ci中出現詞頻f(t,ci);

S122、計算每個類別ci的詞頻總數f(ci)=∑tf(t,ci);

S123、計算特征-類別詞頻與類別總詞頻的相對比例:

f′(t,ci)=f(t,ci)/f(ci);

S124、計算特征在訓練數據集中的熵值:

Entropy(t)=Σi=0np(t,ci)log(p(t,ci))]]>

其中,n為類別的總數目;

S125、采用邏輯斯蒂方程計算特征的分類貢獻度:

weight(t)=11+eentropy(t)-threshold]]>

其中,threshold是歸一化閾值;

S2、基于Hadoop分布式計算平臺,采用MapReduce計算框架進行設計的,分為兩輪MapReduce操作組合;

在第一輪Map操作中,訓練集被平均拆分為多個子訓練集并分配到進行運算的節點上,每一個待分類的測試數據同時在不同節點上,分別與該節點中的子訓練集進行相似度計算;在第一輪Reduce操作中,在各個節點中對Map計算得到的相似度進行排序,獲得每個節點上與測試樣本數據的局部最相似的k個訓練集樣本;

在第二輪Map操作中,將每個節點中的局部最相似的k個訓練集樣本的相似度和類別進行統計,在第二輪Reduce操作中,各個訓練集樣本以相似度進行投票,選出相似度最大的類別作為測試樣本數據的預測類別;其中第二輪MapReduce操作組可以根據集群節點數目酌情變換成多輪MapReduce操作組合。

2.根據權利要求1所述的基于信息熵特征權重量化的海量短文本分布式KNN分類方法,其特征在于,步驟S2具體為:

S21、將訓練數據集劃分成n個子集,其中n為Hadoop平臺中負責運算的從屬節點個數;

S22、每個從屬節點在讀入訓練數據子集時,建立一個特征與包含該特征的文檔之間的索引,表示為:<ti:qi,…,qk>,其中ti是特征,qi為包含ti的文檔,該索引用來快速查找包含某個特征的文檔集合,另外,建立一個文檔向量模的緩存單元;

S23、對于一個待分類的測試文檔數據q,同時分派給每個從屬節點,在每個節點中,首先初始化A[1]-A[k]作為q的初始近鄰,A[1]-A[k]按q與A[i]的相似度similarity(q,A[i])降序排序,然后通過查找索引找出包含q中特征的所有訓練集文檔<qi,…,qk>作為候選鄰居集合,依次計算q與每個候選鄰居qi的余弦相似度,q與qi的相似度的計算公式為:在計算相似度時,查找緩存單元中是否包含帶計算文檔qi向量的模值||qi||,若存在,將模值取出進行計算;若不存在,首先計算該文檔向量的模值,然后加入緩存單元,將得到的similarity(q,qi)與similarity(q,A[i])比較,其中i∈[1,k],找出第一個similarity(q,A[i])<similarity(q,qi)的A[i],若i∈[1,k],則將A[j+1]=A[j],其中j∈[i,k],并令A[i]=qi;否則,繼續與下一個候選鄰居進行相似性計算,最終,A[1]-A[k]即為每個節點中與q局部最相似的k個鄰居;

S24、將每個節點中的局部最相似的k個鄰居采用多路歸并排序算法進行排序找出全局最相似的k個鄰居,將該k個鄰居以相似度進行預測類別投票,取出相似度最大的類別作為q的預測類別。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410150855.2/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久综合国产伦精品免费| 午夜wwww| 久久婷婷国产综合一区二区| 中文字幕一区二区在线播放| 99久久精品免费视频| 国产乱码一区二区| 久久第一区| 狠狠色噜噜狠狠狠狠综合久| 国产在线精品区| 欧美日韩一区二区三区精品 | 国语对白老女人一级hd| 日韩精品一区在线观看| 中文字幕在线一区二区三区| 色乱码一区二区三区网站| 一区精品二区国产| 99国产精品九九视频免费看| 免费观看又色又爽又刺激的视频| 日本白嫩的18sex少妇hd| 国产一区二区四区| 久久精品国产色蜜蜜麻豆| 狠狠色很很在鲁视频| 福利片91| 国产天堂第一区| 欧美激情在线免费| 欧洲另类类一二三四区| 夜色av网站| 天天射欧美| 欧美国产一二三区| 97人人模人人爽视频一区二区| 国产69久久| 国产一二区在线| 国产伦精品一区二区三区无广告| 日韩区欧美久久久无人区| 国产精品日韩视频| 玖玖玖国产精品| 中文字幕欧美一区二区三区 | 亚洲欧美另类久久久精品2019| 国产精品视频1区| 精品99在线视频| 日本一区二区三区免费在线| 欧美精品九九| freexxxxxxx| 99久久精品国| 欧美精品一卡二卡| 一色桃子av大全在线播放| 欧美一区二三区人人喊爽| 偷拍区另类欧美激情日韩91| 精品国产91久久久| 一区二区在线国产| 日韩精品免费播放| 中文字幕一区二区三区免费视频| 狠狠色噜噜狠狠狠狠69| 日本高清一二三区| 日本精品一二三区| 国产一区二区在线91| 久久久久亚洲精品视频| 国产精品久久久久久久久久不蜜月| 色妞妞www精品视频| 91国偷自产一区二区介绍| 国产一区日韩欧美| 狠狠色噜噜狠狠狠狠视频| 国产剧情在线观看一区二区| 国产乱子一区二区| 日韩有码一区二区三区| 国产资源一区二区三区| 久久精品国产一区二区三区不卡| 日本一码二码三码视频| 精品久久不卡| 日韩精品中文字幕在线| 午夜黄色网址| 国产真实乱偷精品视频免| 欧美一区免费| 一区二区在线精品| 欧美视频1区| 国产日韩欧美另类| 国产乱人伦偷精品视频免下载| 999国产精品999久久久久久| 久久综合久久自在自线精品自| 亚洲激情中文字幕| 欧美日韩一区免费| 精品综合久久久久| 国产一区二区三区大片| 丰满少妇高潮惨叫久久久一| 国产午夜一级一片免费播放| 国产欧美日韩精品一区二区图片| 国产一区日韩一区| 国产91视频一区| xxxx国产一二三区xxxx| 日本边做饭边被躁bd在线看| 美日韩一区| 一本色道久久综合亚洲精品浪潮| 国产精品香蕉在线的人| 91亚洲国产在人线播放午夜| 热久久一区二区| 欧美乱妇高清无乱码免费| 精品国产一区二| 国产一级一区二区| 日韩a一级欧美一级在线播放| 国产91麻豆视频| 日韩精品久久一区二区| 一区二区在线视频免费观看 | 亚洲国产99| 中文字幕在线一二三区| 国产欧美二区| 日本一区二区在线电影| 国产91一区二区在线观看| 久久久久久国产精品免费| 精品国产乱码久久久久久老虎| 国产三级在线视频一区二区三区| 日韩亚洲欧美一区二区| 国产理论片午午午伦夜理片2021 | 91制服诱惑| 国产一区精品在线观看| 国产精品96久久久| 中文无码热在线视频| 欧美一区二区三区四区五区六区 | 片毛片免费看| 精品国产亚洲一区二区三区| 国产欧美一区二区三区沐欲 | 久久五月精品| 精品国产一区二区三区忘忧草| 99国产精品99久久久久久粉嫩| 久久久精品99久久精品36亚| 欧美一区二区三区国产精品| 欧美69精品久久久久久不卡| 欧美精品一区二区三区在线四季| 一色桃子av| 精品一区电影国产| 色婷婷噜噜久久国产精品12p| 少妇性色午夜淫片aaa播放5| 麻豆精品国产入口| 国产精品国产亚洲精品看不卡15| 李采潭无删减版大尺度| 国产欧美亚洲一区二区| 99视频一区| a级片一区| 日本一区二区在线电影| 少妇自拍一区| 国产伦精品一区二区三区电影| 国产精品久久人人做人人爽| 国产午夜精品一区二区理论影院| 国产精品一区二区毛茸茸| 欧美69精品久久久久久不卡| 在线视频国产一区二区 | 亚洲国产精品网站| 浪潮av色| 满春阁精品av在线导航| 少妇久久精品一区二区夜夜嗨| 国产一区二区在线精品| 91精品一区二区在线观看| 国产精品一区在线观看| 九九国产精品视频| 国产一区二区视频播放| 久久国产精品欧美| 精品欧美一区二区精品久久小说| 久久久精品99久久精品36亚| 午夜免费片| 午夜毛片在线| 午夜av影视| 人人要人人澡人人爽人人dvd| 日韩午夜毛片| 国产高清一区在线观看| 一区二区午夜| 日日夜夜精品免费看| 国产精品6699| 亚洲少妇一区二区三区| 中文字幕a一二三在线| 午夜黄色一级电影| 国产日韩欧美三级| 国产一区二区三区小说| 国产精品第157页| 国产1区在线观看| 久久国产欧美视频| 精品一区电影国产| 欧美乱妇高清无乱码| 色午夜影院| 国产视频一区二区不卡| 日韩中文字幕亚洲精品欧美| 久免费看少妇高潮a级特黄按摩| 日韩一级视频在线| 国产精品午夜一区二区三区视频| 久久亚洲精品国产一区最新章节| 国产精品久久久麻豆| 午夜爽爽视频| 99久久久国产精品免费无卡顿| 欧美髙清性xxxxhdvid| 国产精品天堂| 国产真实一区二区三区| 狠狠操很很干| 日韩av在线播| 国产色婷婷精品综合在线播放| 国产91九色在线播放| 小萝莉av| 香港三日本8a三级少妇三级99 | 日韩av在线播放网址| 欧美高清xxxxx| 亚洲高清乱码午夜电影网| 亚洲四区在线| 日韩不卡毛片| 狠狠色噜狠狠狠狠| 色一情一乱一乱一区免费网站 | 久久99精品国产麻豆婷婷洗澡| 一区二区在线精品| 欧美一区二区三区免费在线观看| 猛男大粗猛爽h男人味| 一区精品二区国产| 毛片免费看看| 精品久久久影院| 欧美日韩激情在线| 亚洲五码在线| 午夜毛片影院| 夜夜精品视频一区二区| 日韩欧美国产精品一区| 99视频国产精品| 国产乱xxxxx国语对白| 国产精品天堂网| 午夜精品999| 少妇av一区二区三区| 97人人模人人爽人人喊0| 91精品国产综合久久国产大片| 少妇高潮大叫喷水| 国产欧美一区二区三区免费视频| 精品国产一区二区在线| 国产乱xxxxx97国语对白| 国产在线不卡一| 欧美日韩国产色综合视频| 国产偷亚洲偷欧美偷精品| 国产伦理精品一区二区三区观看体验 | 久久不卡精品| 欧美xxxxhdvideos| 国产一区亚洲一区| 亚洲国产欧美国产综合一区| 欧美亚洲视频二区| 国产精品伦一区二区三区视频| 一本色道久久综合亚洲精品图片| 国产麻豆一区二区三区精品| 国产日韩欧美第一页| 蜜臀久久99精品久久久久久网站| 欧美系列一区| xxxx18hd护士hd护士| 久久乐国产精品| 国产一区在线免费| 欧美日韩一区二区三区在线播放| 亚洲国产精品麻豆| 夜色av网站| 四虎国产精品永久在线|