日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種混合的文本特征詞匯提取方法在審

專利信息
申請?zhí)枺?/td> 201610864911.8 申請日: 2016-09-30
公開(公告)號: CN106610952A 公開(公告)日: 2017-05-03
發(fā)明(設(shè)計)人: 金平艷 申請(專利權(quán))人: 四川用聯(lián)信息技術(shù)有限公司
主分類號: G06F17/27 分類號: G06F17/27;G06F17/30
代理公司: 暫無信息 代理人: 暫無信息
地址: 610054 四川省成*** 國省代碼: 四川;51
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 混合 文本 特征 詞匯 提取 方法
【說明書】:

技術(shù)領(lǐng)域

發(fā)明涉及語義網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及一種混合的文本特征詞匯提取方法。

背景技術(shù)

文本特征指的是最能代表文本主旨的詞匯集合,文本特征不僅可以很好的概括文本主要內(nèi)容和主旨,而且可以降低文本處理的復(fù)雜程度。目前常用的文本特征提取方法,包括詞頻-反文檔頻率方法、信息增益等方法。詞頻-反文檔頻率方法的簡單結(jié)構(gòu)并不能有效地反映詞匯或短語的重要程度和特征值的分布情況,所以TF-IDF的精度并不是很高。信息增益方法只適合用來提取一個類別的文本特征,而無法用于提取多個類別的文本特征。上述兩種文本特征提取方法沒有文本集合或沒有事先分好類別,僅僅給出一個文本,那么將無法提取這個文本的特征,這兩種方法的優(yōu)點在于計算速度快,但是計算結(jié)果的精度不高。文本挖掘與非文本挖掘的一個重要的區(qū)別就是,文本是非結(jié)構(gòu)化的數(shù)據(jù)。為了把數(shù)據(jù)挖掘的算法應(yīng)用到文本對象之上,就必須對文本進行預(yù)處理,使文本最終表示成為一種結(jié)構(gòu)化的形式,同時需要保證這種結(jié)構(gòu)化的形式能夠充分體現(xiàn)出文本對象自己的特點,突出文本對象間的差異,以便于文本的區(qū)分。文本的預(yù)處理技術(shù)對于文本挖掘來說是一個非常重要的環(huán)節(jié)??梢哉f,預(yù)處理的質(zhì)量直接影響到了最終的挖掘結(jié)果。為了滿足上述需求,本發(fā)明提供一種混合的文本特征詞匯提取方法。

發(fā)明內(nèi)容

針對于常用的文本特征提取方法都需要大量的訓(xùn)練集作為提取的前提,僅僅給出一個文本,那么將無法提取這個文本特征以及常用的文本特征提取方法精度不高的不足,本發(fā)明提供了一種混合的文本特征詞匯提取方法。

為了解決上述問題,本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:

步驟1:利用中文分詞技術(shù)對文本進行分詞處理;

步驟2:根據(jù)停用表對文本詞匯進行去停用詞處理;

步驟3:根據(jù)詞匯在文本中的位置得到一系列詞匯位置權(quán)重值(α1,α2,…,αn);

步驟4:根據(jù)詞匯在文本中的詞性得到一系列詞匯詞性權(quán)重值β1、β2、β3、β4

步驟:5:綜合上述位置與詞性,根據(jù)詞匯在文本中信息量,得到詞匯的權(quán)重 貢獻公式RE(ci,c(w1)),提取第一位c(w1)與按RE(ci,c(w1))值從大到小排列的后續(xù)m位,即為文本特征詞匯集合。

步驟6:綜合詞匯語義相似度方法,構(gòu)造詞匯語義網(wǎng)絡(luò)模型圖;

步驟7:根據(jù)ε鄰域方法,得到詞匯在整個詞匯語義網(wǎng)絡(luò)模型中的重要度,找到滿足重要度條件的文本特征詞匯集合。

本發(fā)明有益效果是:

1、此方法比傳統(tǒng)的詞頻-反文檔頻率方法得到的特征詞匯集合的準確度更高。

2、此方法克服了信息增益方法只適合用來提取一個類別的文本特征的缺點。

3、此方法在文本特征提取方法沒有文本集合或沒有事先分好類別,僅僅給出一個文本條件下,可以提取這個文本的特征。

4、為后續(xù)的文本相似度與文本聚類技術(shù)提供良好的理論基礎(chǔ)。

5、此算法具有更大的利用價值。

6、此方法精確地計算了特征詞匯中不同詞匯對文本思想的貢獻度。

7、此方法相較之前的方法條件更加嚴苛,得到的結(jié)果準確度更高。

附圖說明

圖1一種混合的文本特征詞匯提取方法的結(jié)構(gòu)流程圖

圖2為n元語法分詞算法圖解

圖3中文文本預(yù)處理過程流程圖

圖4詞匯語義網(wǎng)絡(luò)模型圖

具體實施方式

為了解決常用的文本特征提取方法都需要大量的訓(xùn)練集作為提取的前提,僅僅給出一個文本,那么將無法提取這個文本特征以及常用的文本特征提取方法精度不高的的問題,結(jié)合圖1-圖4對本發(fā)明進行了詳細說明,其具體實施步驟如下:

步驟1:利用中文分詞技術(shù)對文本進行分詞處理,其具體分詞技術(shù)過程如下:

步驟1.1:根據(jù)《分詞詞典》找到待分詞句子中與詞典中匹配的詞,把待分詞的漢字串完整的掃描一遍,在系統(tǒng)的詞典里進行查找匹配,遇到字典里有的詞就標識出來;如果詞典中不存在相關(guān)匹配,就簡單地分割出單字作為詞;直到漢字串為空。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川用聯(lián)信息技術(shù)有限公司,未經(jīng)四川用聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201610864911.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品96久久久| 国产女人好紧好爽| 国产一区二区视频播放| 国产三级在线视频一区二区三区| 中文字幕一区一区三区| 精品欧美一区二区在线观看| 国产在线一二区| 欧美一区二区三区黄| 年轻bbwbbw高潮| 午夜影院一级| av午夜在线观看| 欧美精品九九| 国模吧一区二区| 亚洲欧美国产精品久久| 国产天堂第一区| 99精品欧美一区二区三区美图| 国产一区影院| 国产一区二区电影| 国产伦理精品一区二区三区观看体验| 狠狠色狠狠色综合系列| 二区三区视频| 狠狠色狠狠色88综合日日91| 黄毛片在线观看| 亚洲高清乱码午夜电影网| 国产精品高潮呻吟三区四区| 欧美激情午夜| 偷拍精品一区二区三区| 精品少妇的一区二区三区四区| 欧美精品日韩| 国产伦精品一区二区三区免费观看| 国产精品三级久久久久久电影| 国产日本欧美一区二区三区| 99日本精品| 国产高清在线一区| 91精品福利观看| 中文字幕国内精品| 中文字幕日韩一区二区| 中文字幕天天躁日日躁狠狠躁免费| 99久久婷婷国产亚洲终合精品| 在线精品一区二区| **毛片免费| 素人av在线| 欧美日韩中文字幕一区二区三区| 青苹果av| 久久噜噜少妇网站| xxxx18hd护士hd护士| 欧美日韩一区二区三区不卡| 丰满岳乱妇在线观看中字| 欧美精品国产精品| 91麻豆产精品久久久| 久久免费视频一区二区| 欧美日本91精品久久久久| 国产欧美日韩中文字幕| 久久噜噜少妇网站| 欧美一区二区精品久久| 国产www亚洲а∨天堂| 午夜av资源| 国产精品香蕉在线的人| 国产精品9区| 午夜影院h| 青苹果av| 亚洲高清国产精品| 欧美精品久久一区| 亚洲国产精品精品| 国产一区二区视频播放| 欧美日韩国产色综合一二三四| 草逼视频网站| 国产69久久| 亚洲欧美日韩在线看| 天干天干天啪啪夜爽爽99| 亚洲国产偷| 护士xxxx18一19| 久久久久国产亚洲| 色综合久久久| 欧美乱大交xxxxx古装| 日韩亚洲欧美一区二区| 久久精品国产亚洲一区二区| 国产亚洲精品久久777777 | 自拍偷在线精品自拍偷无码专区 | 91久久精品国产91久久性色tv | 日韩av在线网| 精品国产一二三四区| 日日夜夜一区二区| 亚洲欧洲国产伦综合| 在线观看欧美日韩国产| 91精品久久久久久综合五月天| 亚洲精品国产suv| 色一情一乱一乱一区免费网站| 国内久久久| 久久五月精品| 国产一区www| 国产精品久久久久久亚洲调教| 国产精品欧美日韩在线| 日本一区欧美| 99久热精品| 狠狠色狠狠色88综合日日91 | 国产精品女人精品久久久天天| 午夜精品一区二区三区在线播放| 黑人巨大精品欧美黑寡妇| 亚洲二区在线播放视频| 亚洲福利视频一区| 满春阁精品av在线导航| 欧美一区二区三区在线视频观看| 日韩精品中文字幕一区| 国产在线精品二区| 午夜看片在线| 搡少妇在线视频中文字幕| 国产视频在线一区二区| 精品国产免费一区二区三区| 中文乱码字幕永久永久电影| 91精品久久久久久综合五月天| 满春阁精品av在线导航| 日韩av一区二区在线播放| 欧美一区二区三区免费在线观看| 久久一级精品| 国产精品自产拍在线观看蜜| 国产一区欧美一区| 99久热精品| 欧美乱大交xxxxx胶衣| 国产伦精品一区二区三区电影| 国产精品不卡一区二区三区 | 欧美精品日韩一区| 日韩欧美高清一区| 国产一区网址| 精品国产九九九| 6080日韩午夜伦伦午夜伦| 一区精品二区国产| 狠狠插影院| 99国产精品久久久久99打野战| 扒丝袜pisiwa久久久久| 国产精品一二三区视频网站| 99精品久久久久久久婷婷| 4399午夜理伦免费播放大全| 亚洲精品suv精品一区二区| 国产一区二区三区影院| 天干天干天啪啪夜爽爽99| 午夜一区二区视频| 国产亚洲欧美日韩电影网| 国产一区二区四区| 精品福利一区| 欧美日韩中文国产一区发布| 久久久久偷看国产亚洲87| 亚洲乱玛2021| 国产一区日韩欧美| 在线播放国产一区| 亚洲精品国产setv| 国产一级大片| 欧美日韩一区二区三区在线观看视频| 国产天堂一区二区三区| 搡少妇在线视频中文字幕| 亚洲女人av久久天堂| 8x8x国产一区二区三区精品推荐| 久久精品入口九色| 午夜激情免费电影| 欧美精品国产一区| 国产人成看黄久久久久久久久| 国产一区2| 男人的天堂一区二区| 午夜看片在线| 午夜影院5分钟| 色噜噜狠狠一区二区| 久久人做人爽一区二区三区小说| 久久99久国产精品黄毛片入口 | 夜色av网| 国产精品欧美一区乱破| 国产日韩欧美中文字幕| 国产精品18久久久久久白浆动漫| 超碰97国产精品人人cao| 国产精品国产三级国产专区53| 中文字幕在线播放一区| 日韩av三区| 久久99精品国产麻豆婷婷| 欧美日韩精品在线播放| 狠狠色噜噜狠狠狠狠| 对白刺激国产对白精品城中村| 视频一区二区三区欧美| 亚洲福利视频一区二区| 亚洲国产精品区| 玖玖玖国产精品| 欧美日韩亚洲国产一区| 免费xxxx18美国| 狠狠干一区| 久久精品一二三| 国产一区二区在线观看免费| 国产欧美日韩一级大片| 国产精品欧美日韩在线| 91麻豆精品国产91久久久资源速度| 日韩欧美国产中文字幕| 国产精品自拍在线观看| 久久夜色精品国产亚洲| 亚洲w码欧洲s码免费| 亚洲精品久久久久www| 性国产日韩欧美一区二区在线| 国产一区二区在线精品| 亚洲精品乱码久久久久久蜜糖图片| 久久午夜精品福利一区二区| 色婷婷精品久久二区二区蜜臂av| 国产精品无码永久免费888| 麻豆精品一区二区三区在线观看| 精品一区电影国产| 色综合久久精品| 国产一级不卡毛片| 国产二区视频在线播放| 香蕉av一区| 国产视频精品久久| 亚洲乱小说| 国产精品一二三四五区| 日韩av在线一区| 国产精品一区二区免费视频| 亚洲精品国产综合| 国产精品亚发布| 欧美午夜理伦三级在线观看偷窥| 欧美精品免费视频| а√天堂8资源中文在线| 91精品久久久久久综合五月天| 日韩av在线高清| 国产亚洲精品久久19p| 国产三级国产精品国产专区50| 欧美日韩国产123| 视频二区一区国产精品天天| 欧美激情视频一区二区三区免费| 香蕉av一区| 国产伦精品一区二区三区照片91| 久久99精品国产麻豆婷婷洗澡| 午夜裸体性播放免费观看| 二区三区免费视频| 亚洲乱小说| 国产精品v亚洲精品v日韩精品| 亚洲精品久久久中文| 亚洲福利视频二区| 国产欧美日韩二区| 久99久精品| 国产欧美亚洲一区二区| 国产在线一二区| 美女销魂免费一区二区| 亚洲欧洲日本在线观看| 国产精品高潮呻| 午夜wwwww| 99久久久久久国产精品| 偷拍久久精品视频| 香蕉av一区二区三区| 久久99精品国产麻豆婷婷| 亚洲区日韩| 狠狠色狠狠色综合久久第一次| 91亚洲国产在人线播放午夜| 91波多野结衣|