日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于局部隨機詞匯密度模型POI中文文本分類的方法有效

專利信息
申請號: 201310577670.5 申請日: 2013-11-19
公開(公告)號: CN103605729B 公開(公告)日: 2017-06-06
發明(設計)人: 段煉;胡寶清;覃開賢 申請(專利權)人: 段煉
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京輕創知識產權代理有限公司11212 代理人: 談杰
地址: 廣西壯族自治區南*** 國省代碼: 廣西;45
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 局部 隨機 詞匯 密度 模型 poi 中文 文本 分類 方法
【權利要求書】:

1.一種基于局部隨機詞匯密度模型POI中文文本分類的方法,其特征在于,該基于局部隨機詞匯密度模型海量興趣點POI中文文本分類的方法包括以下步驟:

采用貝葉斯分類器判斷文本主題是否為POI相關,利用改進的詞匯集中度、離散度和頻度方法,篩選出特征詞以構建特征空間;

依據文本與各POI類別的相似度進行局部區域劃分,在每個局部區域內通過特征映射矩陣將文本轉為特征向量;

最終利用SVM進行POI文本分類;

具體的步驟為:

第一步,文檔有效性判斷:采用貝葉斯分類器,基于文檔詞頻向量模型進行分類器訓練,只要文本中含有較多某一類或若干類POI常涉及的詞匯,則即可被判斷為有效;再建立局部隨機詞匯密度模型;

第二步,基于詞匯離散度、集中度和頻度選取出特征詞,以特征詞為維度構建特征空間;

第三步,局部區域劃分:在局部區域劃分方法中,屬于同一POI類別的文本均屬于相同的局部區域,且每個局部區域需包含其他各類別一定數量的文本作為反例,為每個局部區域設置反例文本數量的方法為:

設類別總數為m,當前設置反例數量的類別為cx,計算ci(i∈{1,…,x-1,x+1,…,m})中所有文檔與類別cx的相似度(dij表示ci類別中第j篇文檔),相似度大于閾值λ的文本作為cx的反例,相似度公式為:

<mrow><msub><mi>l</mi><mrow><msub><mi>d</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>&RightArrow;</mo><msub><mi>c</mi><mi>x</mi></msub></mrow></msub><mo>=</mo><msup><mrow><mo>(</mo><mfrac><mrow><munderover><mo>&Sigma;</mo><mrow><mi>v</mi><mo>=</mo><mn>0</mn></mrow><mrow><mo>|</mo><msub><mi>c</mi><mi>x</mi></msub><mo>|</mo></mrow></munderover><msub><mi>dist</mi><mrow><mi>i</mi><mi>j</mi><mo>&RightArrow;</mo><mi>x</mi></mrow></msub><mrow><mo>(</mo><msub><mi>d</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>,</mo><msub><mi>d</mi><mrow><mi>x</mi><mi>v</mi></mrow></msub><mo>)</mo></mrow></mrow><mrow><mo>|</mo><msub><mi>c</mi><mi>x</mi></msub><mo>|</mo></mrow></mfrac><mo>)</mo></mrow><mrow><mo>-</mo><mn>1</mn></mrow></msup></mrow>

其中,distij→x(dij,dxv)為類別i內文檔j和類別cx內文檔v的文本距離;

第四步,局部特征映射矩陣的獲取:求解每個局部區域內的映射矩陣Mj(j表示第j個局部區域),映射矩陣的獲取過程,Mj表示為M,具體方法為:

步驟一,定義

詞匯表:W={w1,w2,…,wn},為POI文本集中所有的詞匯,其中詞匯總數為n=|W|;

文檔詞頻向量模型:d={x1,x2,…,xj,…xn},其中,xj代表詞匯wj在文檔中出現的次數;

某局部文檔集合:X={d1,d2,…,dt},t=|X|,為某局部區域文檔數量;

文檔類別:Y={y1,y2,…,yc},其中,yj表示cj類別的文本數量;

特征詞:F={wf1,wf2,…,wfr}∈W,其中,r=|F|且r<<n,為特征詞數量,也為特征空間的維度總數;

步驟二,虛擬文檔構建

基于概率p刪除原始文本詞頻向量中的每一個詞匯,經過u次這樣的操作,便為每個文本向量di創建u個虛擬文檔矢量

步驟三,局部特征映射矩陣計算公式:假設存在特征向量用以表達文本di在局部區域內的正確特征向量,學習映射矩陣以使得所有虛擬文檔通過其被轉換到特征空間后,與其正確特征向量的誤差平方和最小:

<mrow><mi>&Delta;</mi><mi>d</mi><mfrac><mn>1</mn><mn>2</mn></mfrac><mo>&times;</mo><mi>t</mi><mo>&times;</mo><mi>u</mi><mo>&times;</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>t</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>u</mi></munderover><mo>|</mo><mo>|</mo><msub><mover><mi>d</mi><mo>&OverBar;</mo></mover><mi>i</mi></msub><mo>-</mo><mi>M</mi><msup><msub><mover><mi>d</mi><mo>^</mo></mover><mi>i</mi></msub><mi>j</mi></msup><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup></mrow>

由上,可在局部區域中利用局部區域文檔定義局部虛擬文檔集合矩陣:

類似,在局部文檔空間中定義t組由所有文檔的正確特征向量構成的矩陣,其中每組包含u個相同的正確文本特征向量:

由此,局部區域文本重構誤差平方為:

<mrow><mi>&Delta;</mi><mi>D</mi><mo>=</mo><mfrac><mn>1</mn><mn>2</mn></mfrac><mi>t</mi><mi>u</mi><mo>|</mo><mo>|</mo><mover><mi>D</mi><mo>&OverBar;</mo></mover><mo>-</mo><mi>M</mi><mover><mi>D</mi><mo>^</mo></mover><mo>|</mo><msubsup><mo>|</mo><mi>F</mi><mn>2</mn></msubsup></mrow>

其中,為Frobenius平方范式,上式的最小化可以通過最小線性二乘法求得:

M=RQ-1,而

第五步,映射矩陣求解:假設該局部區域中虛擬文檔向量的總數趨向于無窮,即t→∞,這時式中的R和Q將收斂到他們的期望值,變為:

M=E[R]E[Q]-1

而R和Q的期望值分別為:

<mrow><mi>E</mi><mo>&lsqb;</mo><mi>R</mi><mo>&rsqb;</mo><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>t</mi></munderover><mi>E</mi><mrow><mo>&lsqb;</mo><mrow><msub><mover><mi>d</mi><mo>&OverBar;</mo></mover><mi>i</mi></msub><msup><msub><mover><mi>d</mi><mo>^</mo></mover><mi>i</mi></msub><mi>T</mi></msup></mrow><mo>&rsqb;</mo></mrow><mo>,</mo><mi>E</mi><mo>&lsqb;</mo><mi>Q</mi><mo>&rsqb;</mo><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>t</mi></munderover><mi>E</mi><mrow><mo>&lsqb;</mo><mrow><msub><mover><mi>d</mi><mo>^</mo></mover><mi>i</mi></msub><msubsup><mover><mi>d</mi><mo>^</mo></mover><mi>i</mi><mi>T</mi></msubsup></mrow><mo>&rsqb;</mo></mrow></mrow>

標準因子分解能求解出期望值,定義矢量q:

其中,(1-p)為詞匯在虛擬文檔向量中的存在概率,由局部文檔的散布矩陣為S=DDT,可知:

E[R]αβ=Sαβqα;E[Q]αβ=Sαβqαqβ,if α≠β或E[Q]αβ=Sαβqα,if α=β

其中,α、β分別為矩陣的行列值,E[Q]對角線上的元素為同一詞匯相乘的結果,詞匯在虛擬文檔向量中存在的概率為(1-p),因此,E[Q]對角線上的元素等于S乘上q,而E[Q]非對角線上的元素為兩個不同詞匯相乘的結果,因此,兩個不同詞匯同時存在的概率為(1-p)2,即E[Q]非對角線上的元素等于S乘上qα和qβ

第六步,特征向量的歸一化:通過線性映射M:可將文檔轉換到特征空間,為了對大規模POI文本向特征空間轉換時表達和計算的方便,利用sigmoid函數對映射公式進行平滑和歸一化處理:

<mrow><msub><mi>s</mi><mi>i</mi></msub><mo>=</mo><mi>s</mi><mi>i</mi><mi>g</mi><mi>m</mi><mi>o</mi><mi>i</mi><mi>d</mi><mrow><mo>(</mo><msub><mi>Md</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mrow><mn>1</mn><mo>+</mo><msup><mi>e</mi><mrow><mo>-</mo><mi>a</mi><mrow><mo>(</mo><msub><mi>Md</mi><mi>i</mi></msub><mo>+</mo><mi>b</mi><mo>)</mo></mrow></mrow></msup></mrow></mfrac></mrow>

此時,原始文檔向量di通過映射矩陣M即可對應到特征空間向量si,其中a和b為可調系數,以便依據POI文本集中詞匯分布特點調整特征詞之間的語義距離;

第七步,詞匯刪除和重建過程的迭代:映射矩陣對不同文本中特征詞與普通詞的映射能力較弱,這可通過第一步至第五步迭代執行,讓映射矩陣進一步反映特征詞之間的語義關系來解決這一問題,即在每次迭代中將局部區域文本通過映射矩陣Mj轉為特征向量,再將特征向量作為原始文本向量,再一次進行詞匯刪除和重建過程,從而得到新的特征映射矩陣Mj+1,依此反復,最終存在一個k值,使得經過k次迭代后,文檔特征向量收斂于某個固定向量;

假設文檔di經過了k次模型迭代,最終得到的特征空間向量為:

<mrow><msub><mi>s</mi><mi>i</mi></msub><mo>=</mo><msup><mrow><mo>{</mo><mfrac><mrow><msubsup><mi>s</mi><mi>i</mi><mn>1</mn></msubsup><mo>+</mo><mn>...</mn><mo>+</mo><msubsup><mi>s</mi><mi>i</mi><mi>k</mi></msubsup></mrow><mi>k</mi></mfrac><mo>}</mo></mrow><mi>T</mi></msup><mo>;</mo></mrow>

第八步,分類器訓練和分類:在每個局部區域中,利用其映射矩陣將訓練集中所有文本轉換為特征向量,并放入該局部區域的二值分類器進行訓練,之后該分類器就能用來判斷測試文本是否為該局部區域所屬的POI類別,同樣,在每個局部區域執行第二步至第七步的操作,即可最終判斷測試文本所屬的POI類別。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于段煉,未經段煉許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310577670.5/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: **毛片在线免费观看| 91精品久久久久久| 免费在线观看国产精品| 护士xxxx18一19| 亲子乱子伦xxxx| 99日韩精品视频| 国产美女视频一区二区三区| 久久国产精久久精产国| 国产精品尤物麻豆一区二区三区| 偷拍久久精品视频| 91视频一区二区三区| 国产超碰人人模人人爽人人添| 97久久精品人人澡人人爽| 久久人做人爽一区二区三区小说 | 天堂av色婷婷一区二区三区| 久久人做人爽一区二区三区小说| 夜夜躁日日躁狠狠久久av| 欧美在线视频二区| 国产乱人伦精品一区二区三区| 久久er精品视频| 性精品18videosex欧美| 91看片淫黄大片91| 日韩精品乱码久久久久久| 欧美精品一区二区三区久久久竹菊| 精品99在线视频| av午夜在线| 久久夜靖品2区| 亚洲欧美日韩另类精品一区二区三区| 狠狠色狠狠综合久久| 麻豆精品国产入口| 强制中出し~大桥未久10在线播放| 午夜爽爽爽男女免费观看 | 福利视频亚洲一区| **毛片在线| 日韩精品免费一区二区中文字幕| 国产欧美日韩一区二区三区四区| 中文字幕一区三区| 欧美视屏一区二区| 国产一区二区三区影院| 亚洲码在线| 亚洲精品乱码久久久久久国产主播| 亚洲国产精品二区| 国产精品美女久久久另类人妖| 日韩一级片免费观看| 国产在线欧美在线| 国产91在| 日本一级中文字幕久久久久久| 国产日韩欧美自拍| 欧美一区二区三区激情| 美日韩一区| 欧美日韩偷拍一区| 精品国产伦一区二区三区| 蜜臀久久99精品久久一区二区| 午夜激情影院| 国产在线拍偷自揄拍视频| xxxx18hd护士hd护士| 国产一区二区综合| 中文字幕一区一区三区| 国产一区二区高清视频| 亚洲第一天堂无码专区 | 欧美日韩九区| 热久久一区二区| 久久五月精品| 午夜激情影院| 久久久久久久久亚洲精品一牛 | 午夜激情影院| 99热久久这里只精品国产www | 国产精品九九九九九| 午夜免费网址| 97人人模人人爽视频一区二区 | 岛国精品一区二区| 欧美极品少妇xx高潮| 97国产精品久久| 激情欧美日韩| 亚洲一级中文字幕| 午夜影院5分钟| 狠狠干一区| 欧美日韩久久一区二区| 久久久久久久国产| 亚洲精品乱码久久久久久蜜糖图片| 夜夜躁人人爽天天天天大学生| 久久一区二区三区视频| 欧美freesex极品少妇| 国产一区二区a| 热re99久久精品国99热蜜月| 国v精品久久久网| 免费看性生活片| 93精品国产乱码久久久| 99国产精品丝袜久久久久久| 天天射欧美| 欧美日韩激情一区二区| 狠狠躁夜夜躁2020| 国产在线卡一卡二| 国产欧美视频一区二区三区| 国产精品日韩电影| 精品国产一区二区三区国产馆杂枝| 国产一级片一区| 88国产精品视频一区二区三区| 国产1区2区3区中文字幕| 欧美一区二区三区视频在线观看| 久久精品—区二区三区 | 精品国产一区在线| 国产精品网站一区| 久久国产精品二区| 欧美日韩一区二区三区精品| 91精品一二区| 国产中文字幕一区二区三区| 欧美xxxxhdvideos| 精品99免费视频| 亚洲视频h| 国产精品久久久久久久妇女| 公乱妇hd在线播放bd| 欧美激情片一区二区| 亚洲四区在线| 国产精品视频99| 亚洲精品国产91| 午夜激情电影院| 精品午夜电影| 香港三日三级少妇三级99| 国产一区二区影院| 激情欧美一区二区三区| 精品国产乱码久久久久久虫虫| 一本色道久久综合亚洲精品浪潮| 97久久久久亚洲| 99精品视频一区| 国产一级不卡视频| 精品久久香蕉国产线看观看gif | 日韩精品午夜视频| 日韩欧美国产第一页| 精品久久国产视频| 欧美日韩卡一卡二| 国产精品18久久久久白浆| 精品福利一区二区| 日本一区二区在线电影| 91亚洲精品国偷拍自产| 精品国产乱码久久久久久图片| 日韩一级片免费视频| 久久精品国产99| 国产日韩欧美亚洲| 欧美精品二区三区| 99精品视频一区二区| 日本一区二区在线观看视频| 人人澡超碰碰97碰碰碰| 97欧美精品| 国产97免费视频| 国产呻吟高潮| 免费xxxx18美国| 亚洲一区中文字幕| 神马久久av| 欧美xxxxhdvideos| 精品国产一区二区三区忘忧草| 欧美激情片一区二区| 中文av一区| 夜夜爽av福利精品导航| 麻豆精品久久久| 91精品一区二区中文字幕| 午夜影院伦理片| 欧美xxxxxhd| 欧美日韩一二三四区| xxxx18日本护士高清hd| 激情久久综合网| 日韩精品999| 99精品一区二区| 午夜大片男女免费观看爽爽爽尤物| 欧美xxxxhdvideos| 国产88在线观看入口| 国产亚洲综合一区二区| 欧美日韩一区二区三区不卡视频| 国产精品视频一区二区三| 色综合久久精品| 国产免费一区二区三区网站免费| 99久久国产综合| 狠狠色噜噜狠狠狠合久| 一区二区三区四区视频在线| 国产精品亚发布| 国内精品久久久久久久星辰影视 | 亚洲精品20p| 91波多野结衣| 午夜爽爽爽男女免费观看| 国产一区二区三区乱码| 日韩欧美多p乱免费视频| 国产欧美日韩另类| 国产91在| 性欧美激情日韩精品七区| 美女张开腿黄网站免费| 欧美日韩三区| 蜜臀久久99精品久久久| 欧美日韩卡一卡二| 国产区二区| 少妇又紧又色又爽又刺激视频网站| 国产一级一片免费播放| 精品国产亚洲一区二区三区| 久久99精品久久久久国产越南| 午夜黄色网址| 91精品啪在线观看国产线免费| 午夜国内精品a一区二区桃色| 国产盗摄91精品一区二区三区| 亚洲自偷精品视频自拍| 国产精品一区二区麻豆| 91精品国产综合久久婷婷香| 亚洲欧美国产日韩色伦| 国产日韩欧美亚洲| 日韩精品中文字幕在线| 国产69精品久久久久男男系列 | 欧美乱大交xxxxx胶衣| 狠狠色噜噜综合社区| 国产一级不卡毛片| 午夜色大片| 欧美日韩亚洲另类| 精品国产精品亚洲一本大道| 一区二区三区欧美精品| 精品国产乱码久久久久久久| 国产性猛交| 国产精品免费观看国产网曝瓜| 日日夜夜亚洲精品| 国产特级淫片免费看| 日韩精品一区二区三区不卡| 少妇高清精品毛片在线视频| 国产精品高潮呻吟88av| 日韩精品一区在线观看| 高清欧美精品xxxxx在线看| 日韩av三区| 久久久久亚洲精品视频| 狠狠色狠狠色很很综合很久久| 精品婷婷伊人一区三区三| 91avpro| 国产一区在线视频播放| 国产一区二区黄| 国产乱人乱精一区二视频国产精品 | 精品一区二区在线视频| 日韩无遮挡免费视频| 国产足控福利视频一区| 国产一区二区三区大片| 午夜特片网| 日韩毛片一区| 日韩精品一区二区不卡| 日韩av一二三四区| 国产偷亚洲偷欧美偷精品| 97精品久久人人爽人人爽| 久久国产麻豆| 国产精品suv一区二区6| 中文天堂在线一区| 国产精品国产亚洲精品看不卡15 | 国产乱一区二区三区视频| 午夜毛片电影| 日本精品一二三区|