日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種文本分類方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 201810599385.6 申請(qǐng)日: 2018-06-12
公開(公告)號(hào): CN108829818B 公開(公告)日: 2021-05-25
發(fā)明(設(shè)計(jì))人: 趙莉;姜松浩;張程;趙曉芳;段東圣;杜翠蘭 申請(qǐng)(專利權(quán))人: 中國(guó)科學(xué)院計(jì)算技術(shù)研究所
主分類號(hào): G06F16/35 分類號(hào): G06F16/35
代理公司: 北京泛華偉業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 11280 代理人: 王勇
地址: 100190 北*** 國(guó)省代碼: 北京;11
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 文本 分類 方法
【說明書】:

發(fā)明提供了一種構(gòu)建文本分類模型的方法。該方法包括以下步驟:根據(jù)文本信息的字、詞語和句子的結(jié)構(gòu)特征構(gòu)建訓(xùn)練樣本集,其中,所述訓(xùn)練樣本集中的每一條樣本數(shù)據(jù)對(duì)應(yīng)一條文本信息關(guān)于詞語的特征矩陣A、關(guān)于字的特征矩陣B和該條文本信息對(duì)應(yīng)的類別向量O,O的維度與類別數(shù)量相同;以所述訓(xùn)練樣本集中關(guān)于詞語的特征矩陣A和關(guān)于字的特征矩陣B為輸入,以對(duì)應(yīng)的類別向量O為輸出,訓(xùn)練深度學(xué)習(xí)模型,以獲得文本分類模型。根據(jù)本發(fā)明構(gòu)建的分類模型進(jìn)行分類,能夠提高文本分類的準(zhǔn)確率,尤其適用于短文本分類。

技術(shù)領(lǐng)域

本發(fā)明涉及深度學(xué)習(xí)技術(shù)領(lǐng)域,尤其涉及一種文本分類方法。

背景技術(shù)

文本分類是指按照預(yù)先定義的主題類別,為文檔集合中的每個(gè)文檔確定一個(gè)類別。文本分類技術(shù)在日常生活中具有廣泛的應(yīng)用,例如,對(duì)垃圾短信和郵件的過濾,對(duì)新聞的分組查閱等等。

隨著微博、微信等社交方式的快速發(fā)展,短文本成為一種重要的信息形式,短文本通常具有的特點(diǎn)包括:字?jǐn)?shù)少,短文本的長(zhǎng)度通常都比較短,一般在200字以內(nèi),因此,所包含的有效信息也非常少;更新快,在互聯(lián)網(wǎng)上出現(xiàn)的短文本形式的信息,大部分都是實(shí)時(shí)更新的,刷新速度非常快,例如,聊天信息、微博信息、評(píng)論信息等,并且文本數(shù)量非常龐大;不規(guī)范,短文本中可能存在不規(guī)范用語,例如“94”代表“就是”,“88”代表“再見”,“童鞋”代表“同學(xué)”,又如“傷不起”、“有木有”、“坑爹”等。

在現(xiàn)有技術(shù)中的文本分類方法中,文本分類準(zhǔn)確率不高,尤其對(duì)短文本分類的效果不理想,目前,常用的短文本分類方法有:

第一、基于關(guān)鍵詞匹配的文本分類方法,這是一種比較傳統(tǒng)的方法,需要人工配置某些關(guān)鍵詞,然后與每個(gè)需要分類的文本進(jìn)行關(guān)鍵詞匹配,匹配到不同的關(guān)鍵詞之后再根據(jù)關(guān)鍵詞的性質(zhì)將文本劃分為不同的類別。這種方法需要人工構(gòu)造關(guān)鍵詞的字典,而且對(duì)于新出現(xiàn)的詞需要不斷地更新字典,不能保證分類結(jié)果的準(zhǔn)確性,人工成本也很高,對(duì)于快速更新的大數(shù)據(jù)量的短文本,這種方式存在很明顯的速度慢的問題。

第二、基于傳統(tǒng)機(jī)器學(xué)習(xí)的文本分類方法,該方法將傳統(tǒng)的機(jī)器學(xué)習(xí),例如,分類模型的樸素貝葉斯、支持向量機(jī)(SVM)、K近鄰、邏輯回歸等方法應(yīng)用到文本分類中。這種方法操作簡(jiǎn)單,計(jì)算復(fù)雜度低,但有很大的局限性,例如,樸素貝葉斯解決文本分類問題時(shí)必須滿足位置獨(dú)立性和條件獨(dú)立性的假設(shè),但是這兩種假設(shè)在實(shí)際中并不成立,而且,大多數(shù)傳統(tǒng)的機(jī)器學(xué)習(xí)方法都是針對(duì)小規(guī)模、單標(biāo)號(hào)且平衡的問題設(shè)計(jì)的,對(duì)于大規(guī)模的短文本數(shù)據(jù),高維度的特征表示有很大的局限性。此外,基于傳統(tǒng)機(jī)器學(xué)習(xí)的文本分類方法在數(shù)據(jù)預(yù)處理上需要花費(fèi)大量的時(shí)間,對(duì)文本特征的提取也有很嚴(yán)格的要求,而特征提取的恰當(dāng)與否對(duì)于分類結(jié)果會(huì)有很大的影響。

第三、基于深度學(xué)習(xí)的文本分類方法,該方法將深度學(xué)習(xí),例如全連接神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等應(yīng)用到文本分類中,使用神經(jīng)網(wǎng)絡(luò)處理文本分類時(shí),不需要將大量時(shí)間放到數(shù)據(jù)的預(yù)處理上,將數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)之后,就可以自動(dòng)抽取到有價(jià)值的特征,然后再進(jìn)行后續(xù)的分析處理。盡管這種方法在一定程度上彌補(bǔ)了很多傳統(tǒng)機(jī)器學(xué)習(xí)的缺點(diǎn),但是對(duì)于全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)而言,神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)是文本的高維向量表示,并沒有考慮到語序問題,而一段文本文檔中的詞語的語序往往蘊(yùn)含了大量的有價(jià)值信息,其表述思想與上下文緊密相關(guān)。現(xiàn)有的這種基于深度學(xué)習(xí)的分類方法會(huì)導(dǎo)致丟失大量的有價(jià)值的信息,進(jìn)而使分類結(jié)果不準(zhǔn)確。

因此,需要對(duì)現(xiàn)有技術(shù)進(jìn)行改進(jìn),以提供分類準(zhǔn)確度高的文本分類方法,并且使其更適用于短文本分類。

發(fā)明內(nèi)容

本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的缺陷,提供一種文本分類方法,能夠有效的避免文本信息的丟失,實(shí)現(xiàn)高容錯(cuò)的效果,該方法尤其適用于短文本的分類場(chǎng)景。

根據(jù)本發(fā)明的第一方面,提供了一種構(gòu)建文本分類模型的方法。該方法包括以下步驟:

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)科學(xué)院計(jì)算技術(shù)研究所,未經(jīng)中國(guó)科學(xué)院計(jì)算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810599385.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产精一区二区三区| 国产精品一区二区三区在线看| 国产69精品久久久久777糖心| 日韩女女同一区二区三区| 日本高清二区| 日韩精品一区二区中文字幕| 日本高清二区| 黄色香港三级三级三级| 99国产精品| 亚洲精品主播| 97视频精品一二区ai换脸| 97久久国产亚洲精品超碰热| 国产欧美二区| 日本三级韩国三级国产三级| 国产精品久久久久久久新郎| 日本丰满岳妇伦3在线观看| 日韩午夜电影在线| 一区二区久久精品| 国产亚洲久久| 日韩欧美国产高清91| 国产一区午夜| 91一区二区三区视频| 7777久久久国产精品| 免费精品一区二区三区第35| 一色桃子av大全在线播放| 男女午夜影院| 国产日韩欧美网站| 狠狠色噜噜狠狠狠狠| 日韩av在线播放观看| 欧美一区二区三区国产精品| 国产一区二区三级| 欧美高清xxxxx| 91精品www| 国产乱对白刺激在线视频| 国产精品久久国产三级国电话系列| 国产精品人人爽人人做av片| 免费超级乱淫视频播放| 国产精选一区二区| 日韩欧美国产中文字幕| 人人玩人人添人人澡97| 国产一卡在线| 亚洲码在线| 少妇又紧又色又爽又刺激的视频 | 国产精品一区二区三区在线看| 国产超碰人人模人人爽人人添| 亚洲欧美色一区二区三区| 亚洲精品乱码久久久久久按摩| 国产日韩欧美精品一区二区| 国产欧美一区二区三区视频| 欧美精品日韩| 在线精品国产一区二区三区88| 久久九九国产精品| 狠狠色噜噜狠狠狠四色米奇| 另类视频一区二区| 国产一区二区三区伦理| 欧美67sexhd| 精品国产仑片一区二区三区| 国产aⅴ一区二区| 国产日本欧美一区二区三区| 特级免费黄色片| 国产一区网址| 国产一级自拍| 国产高清一区在线观看| 手机看片国产一区| 久久国产精品-国产精品| 国产在线一二区| 日本中文字幕一区| 91嫩草入口| 欧美系列一区| 狠狠色丁香久久婷婷综合丁香| 亚洲欧美日本一区二区三区| 日韩精品999| 欧美一区二区综合| 精品a在线| 亚洲第一区国产精品| 国产欧美精品va在线观看| 夜夜夜夜曰天天天天拍国产| 国产足控福利视频一区| 国产乱色国产精品播放视频| 亚洲精品www久久久| 亚洲欧美国产精品久久| 国产精品高潮呻吟88av| 中文字幕+乱码+中文字幕一区| 久久精品国产99| 91婷婷精品国产综合久久| 毛片大全免费观看| 亚洲午夜精品一区二区三区| 国产第一区在线观看| 99riav3国产精品视频| 国产一区网址| 91高清一区| 91精品国产91久久久| 久久影院国产精品| 窝窝午夜精品一区二区| 欧美日韩激情一区| 强制中出し~大桥未久10在线播放| 91精品久久久久久久久久| 日韩国产不卡| 欧美久久一区二区三区| 一区二区久久精品| 欧美一区二区激情三区| 日本一区免费视频| 99久久久久久国产精品| 午夜影院5分钟| 久久久精品欧美一区二区免费| 亚洲国产精品日本| 亚洲精品久久久久久久久久久久久久| 欧美日韩国产专区| 视频一区二区三区中文字幕| 久久午夜无玛鲁丝片午夜精品| 欧美一区二区三区久久久| 亚州精品国产| 亚洲精品日本无v一区| 欧美日韩精品在线播放| 欧美日韩一区二区三区精品| 国产理论片午午午伦夜理片2021| 日韩欧美亚洲视频| 国产一级精品在线观看| 性色av色香蕉一区二区| 日本三级韩国三级国产三级| 国产在线不卡一| 亚洲精品国产setv| 日日噜噜夜夜狠狠| 欧美一区二区综合| 国产不卡一区在线| 午夜电影一区| 97人人模人人爽人人喊38tv| 久久噜噜少妇网站| 日韩美一区二区三区| 91精品黄色| 国产999精品久久久久久绿帽| 国产一二三区免费| 欧美激情片一区二区| 国产精品久久久久久久久久软件| 黄色香港三级三级三级| 强制中出し~大桥未久4| 国产精品偷乱一区二区三区| 亚洲第一区国产精品| 国产丝袜在线精品丝袜91| 夜夜夜夜曰天天天天拍国产| 国产一二三区免费| 午夜毛片电影| 欧美大片一区二区三区| 久久精品国产99| 欧美三区视频| 欧美一区二区三区免费视频| 国内精品99| 国产高清不卡一区| 国产乱老一区视频| 国产一区二区播放| 激情欧美一区二区三区| 91久久久久久亚洲精品禁果| 中文字幕亚洲欧美日韩在线不卡| 国产精品久久久久久久久久不蜜月| 亚洲欧美国产中文字幕 | 99国产精品9| 日本少妇一区二区三区| 国产精品一区一区三区| 国产一级一区二区三区| 国产一二区精品| 国产午夜精品一区二区理论影院| 国产精品久久久久久久龚玥菲 | 国产69精品久久久久孕妇不能看 | 欧美日韩激情一区| 欧美日韩精品影院| 欧美激情精品一区| 中文在线一区二区三区| 日韩一级视频在线| 精品少妇一区二区三区免费观看焕| 鲁丝一区二区三区免费| 激情久久一区| av午夜剧场| 狠狠色噜噜狠狠狠狠米奇7777| 日韩精品一区二区不卡| 国产综合亚洲精品| 欧美日韩一区二区三区在线播放| 久久精视频| 精品久久久久久久免费看女人毛片| 亚洲欧洲日韩在线| 国产一二三区免费| 国产欧美日韩综合精品一| 国产二区精品视频| 99er热精品视频国产| 99视频一区| 中文字幕一区二区三区乱码视频| 国产一区二区日韩| 一色桃子av大全在线播放| 中文乱幕日产无线码1区| 97午夜视频| 国产日韩欧美自拍| 久99久视频| 午夜a电影| 久久一二区| 欧美视屏一区| 国产精品精品视频一区二区三区| 毛片大全免费看| 国产91精品高清一区二区三区 | 国产精品偷伦一区二区| 国产1区在线观看| 国产色午夜婷婷一区二区三区 | 国产在线卡一卡二| 精品国产九九| 午夜激情影院| 在线国产一区二区| 日本一区二区三区免费视频| 国产一区二区在线观看免费| 精品一区电影国产| 国产69精品久久久久777糖心| 精品特级毛片| 国产午夜亚洲精品| 亚洲欧美中日精品高清一区二区| 一本色道久久综合亚洲精品浪潮| 婷婷午夜影院| 亚洲一二三在线| 国产欧美日韩二区| 日本一级中文字幕久久久久久| 久久精品国语| 亚洲国产精品网站| 91精品国模一区二区三区| 最新国产精品自拍| 国产麻豆91欧美一区二区| 伊人久久婷婷色综合98网| 欧美综合国产精品久久丁香| 在线中文字幕一区| 91九色精品| 国产精品一区二区久久乐夜夜嗨| 激情欧美一区二区三区| 国产日韩欧美在线一区| 在线国产一区二区三区| 理论片午午伦夜理片在线播放| 免费91麻豆精品国产自产在线观看| 99国产精品免费| 97人人澡人人爽91综合色| 97人人模人人爽人人喊38tv| 91看片淫黄大片91| 一区二区三区香蕉视频| 国产乱一区二区三区视频| 国产精品视频久久久久久| 欧美激情综合在线| 亚洲国产精品日本| 久精品国产| 日韩中文字幕亚洲精品欧美| 鲁丝一区二区三区免费| 性精品18videosex欧美| 欧美日韩一区二区三区在线播放 | 91久久精品在线|