日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于表征增強與融合的文本分類方法在審

專利信息
申請號: 202010668999.2 申請日: 2020-07-13
公開(公告)號: CN111813939A 公開(公告)日: 2020-10-23
發明(設計)人: 劉峰;陳一飛 申請(專利權)人: 南京睿暉數據技術有限公司;陳一飛
主分類號: G06F16/35 分類號: G06F16/35;G06K9/62;G06N3/04;G06N3/08
代理公司: 南京業騰知識產權代理事務所(特殊普通合伙) 32321 代理人: 繆友益
地址: 210000 江蘇省*** 國省代碼: 江蘇;32
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 表征 增強 融合 文本 分類 方法
【說明書】:

發明涉及一種基于表征增強與融合的文本分類方法,包括構建基于表征增強與融合的文本分類模型,輸入文本在基于表征增強與融合的文本分類模型內的處理步驟為:在數據表征層將輸入文本的離散文字轉換為連續特征向量,得到多重的表征向量;在表征增強層將擾動加入表征向量中,得到表征增強向量;在表征抽象層對表征增強向量進一步提取和抽象,得到抽象表征向量;在分類層對抽象表征向量進行分類,得到輸出文本標簽;在融合層綜合各個輸出文本標簽,得到最終的文本標簽。本發明能有效解決現有文本多類分類中存在的樣本數據在類別間分布不平衡、少數類別中樣本數量缺乏時正確分類困難的問題。

技術領域

本發明涉及文本分類技術領域,具體涉及一種基于表征增強與融合的文本分類方法。

背景技術

隨著大數據時代的到來,電子文本數量急劇積累,面對如此龐大的文本數據,對其維護、管理和利用都具有極大的挑戰性。利用文本分類技術,能自動的對大量復雜的文本這種非結構化數據進行分類,可以使用戶更便捷、高效的對資料進行分類歸檔。

文本分類是指計算機將載有信息的一篇文本映射到預先給定的某一類別或某幾類別主題的過程。是自然語言處理中多年來一直研究的課題,也是經典的機器學習技術,其在句法分析、語義分析、信息抽取和web搜索等領域有著重要的應用。在自然語言處理中,文本分類的核心任務是如何表示文本特征,即如何得到文本的表征。在傳統的文本分類中,常用詞袋模型等構建文本向量模型(VSM)進行文本特征表示。為了提取更加有用和獨特的特征,許多其他方法也進展起來,如LDA、PLSA和MI等。盡管許多研究者已經開發了一些更復雜的特征(如樹核等)以提取更多的上下文信息和準確的詞序,但仍然存在數據稀疏、維度災難等問題,這些問題對分類精度有很大影響。為了更好的進行文本特征的表示,隨著神經網絡及深度學習技術的發展,詞的分布表征在許多自然語言處理任務中得到了廣泛的應用。通過對詞分布的表征學習,把文本中出現的最小語義單位——詞(或者字)通過一系列變換轉化為計算機可識別可計算的稠密向量,因此表征學習的模型也稱為詞向量模型。Word2vec、GloVe、ELMo、BERT等一些列的詞向量模型應運而生,其中通過注意力機制和多頭機制獲取了上下文信息的BERT模型更是使自然語言處理的多項任務性能顯著提高。

然而,由于文本數據的復雜性在實際的文本分類應用中仍然存在很多挑戰,使即使利于基于BERT等模型的文本表征,也不能得到理想的文本分類性能。例如:最常見的問題之一是,大量文本分類任務中,數據在類別間分布的不平衡的問題。某一些類別由于存在較多的標注數據,成為多數類別;而另一些類別由于數據難以獲取或難以人工標注,只有較少或極少的標注數據,成為少數類別。這樣使數據同時具有不平衡和缺乏的問題。從不平衡數據中學習分類是一項具有挑戰性的任務。由于每個類的數據數量不均衡,它會對分類器的性能造成嚴重的不利影響。用不平衡數據訓練的分類器傾向于預測屬于大多數的類。因此,它忽略了少數類別的影響,將其與多數類別混為一談。

為了解決分類時的數據分布不平衡的問題,有面向數據和面向算法的解決方式。在算法層面,成本敏感的技術主要通過調整各種類的成本來抵消類的不平衡。成本敏感的技術在沒有改變原始數據數量的情況下,修改原有樣本實例的成本,這樣做計算代價非常昂貴,因此在面對實際問題時,并不切實可行。另外,數據變換是面向數據的一種常用方法,直接對數據進行修改,包括了欠采樣方法、過采樣方法和混合抽樣方法,用于平衡類分布,是一種有效的處理非平衡分類方法。但是,這個簡單的修改并不能解決一個潛在的關鍵問題:并不能真正學習到給定的不平衡數據的分布。幸運的是,深度學習為學習數據分布的隱式表達式提供了一種有效和健壯的方法。尤其是利用對抗學習,可以學習到數據近似真實的分布。

盡管基于對抗學習的方法可以用生成的數據來補充少數類,從而提高分類的性能,但是它們主要關注于圖像數據的增強,如對圖像增加噪聲的低分辨率合成。但是這并不適用于文本數據的增強,因為文本是離散型數據,且加入一個較小的噪聲就會影響整個句子的語義信息,故文本數據增強存在一定的難度。因此,亟需設計一種新的技術方案,以綜合解決現有技術中存在的問題。

發明內容

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京睿暉數據技術有限公司;陳一飛,未經南京睿暉數據技術有限公司;陳一飛許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010668999.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久久人成影片免费观看| 国产日韩区| 国产一区二区三区在线电影| 国产一区二区国产| 国产乱一区二区三区视频| 国产97免费视频| 麻豆国产一区二区| 在线国产一区二区三区| 中文字幕区一区二| 国产一级片网站| 国产精品日韩三级| 国产精品二区一区二区aⅴ| 国产精品国产一区二区三区四区| 国产精品18久久久久久白浆动漫| 国产精品999久久久| 久久综合久久自在自线精品自| 国产高清在线一区| 久久久精品欧美一区二区| 狠狠色噜噜狠狠狠狠777| 久久96国产精品久久99软件| 国产一区二区手机在线观看| 久久精品欧美一区二区| 久久精品国产一区二区三区| 美女直播一区二区三区| 国产一区二区免费在线| 亚洲精品卡一| 国产精品久久久区三区天天噜| 亚欧精品在线观看| 日本精品一区二区三区在线观看视频 | 国产床戏无遮挡免费观看网站 | 国产一区二区高清视频| 久久国产精品网站| 欧美色图视频一区| 国产一区二区三区午夜| 国产一二三区免费| 中文乱幕日产无线码1区| 日韩电影在线一区二区三区| 狠狠色狠狠色合久久伊人| 午夜精品在线播放| 精品综合久久久久| 日韩在线一区视频| 亚洲欧美一卡二卡| 四虎影视亚洲精品国产原创优播| 欧美一级片一区| 久久影视一区二区| 欧美日韩精品在线播放| 精品亚洲午夜久久久久91| 香蕉av一区二区三区| 日本久久不卡| 国产清纯白嫩初高生在线播放性色 | 久久精品二| 国产一区二区极品| 午夜影院激情| 国产视频在线一区二区| 国产精品影音先锋| av午夜影院| 国产日韩欧美一区二区在线观看 | 午夜电影一区二区三区| 久久国产精品久久久久久电车| 久久天天躁夜夜躁狠狠躁2022| 国产黄色网址大全| 亚洲免费精品一区二区| 一区二区国产盗摄色噜噜| 欧美精品久久一区二区| 欧美日韩综合一区二区| 91黄色免费看| 国产精品久久久视频| 国产69精品久久久久孕妇不能看| 欧美综合在线一区| 一区二区三区免费高清视频| 四虎影视亚洲精品国产原创优播| 好吊妞国产欧美日韩免费观看网站| 淫片免费看| 国产69精品久久久久久野外| 欧美在线一区二区视频| 国产目拍亚洲精品区一区| 91黄在线看| 91亚洲欧美强伦三区麻豆| 曰韩av在线| 精品videossexfreeohdbbw| 国产一区免费播放| 国内久久久| 挺进警察美妇后菊| 狠狠色噜噜狠狠狠狠69| 欧美乱妇在线视频播放| 欧美在线视频精品| 国产精品电影免费观看| 国产人澡人澡澡澡人碰视| 狠狠躁夜夜躁2020| 国产精品久久久久久久综合| 久久国产精彩视频| 欧美精品综合视频| 精品国精品国产自在久不卡| 国产精品一区二区av日韩在线| 亚洲精品一区二区三区98年| 亚洲国产精品入口| 欧美日韩国产91| 日本精品在线一区| 国产一区不卡视频| 亚洲精品日日夜夜| 亚洲色欲色欲www| 亚洲国产精品区| 久久99中文字幕| 久久人人爽爽| 亚洲精华国产欧美| 国产一级片一区| 91精品一区在线观看| 欧美精品在线视频观看 | 国产在线不卡一| 色妞www精品视频| 91丝袜国产在线观看| 欧美精品一区二区三区视频| 欧美一区二区色| 国产无遮挡又黄又爽又色视频| 国产精品日产欧美久久久久| 高清国产一区二区三区| 久久二区视频| 国产精品一区二区三区在线看| 久久福利视频网| 国产欧美久久一区二区三区| 免费久久一级欧美特大黄| 欧美在线视频一区二区三区| 97人人模人人爽人人喊38tv| 日本激情视频一区二区三区| 午夜av电影网| av午夜电影| 68精品国产免费久久久久久婷婷 | 精品99免费视频| 国产69精品久久久久孕妇不能看| 久久久久久亚洲精品中文字幕| 国产亚洲精品久久网站| 国产午夜亚洲精品午夜鲁丝片| 中文字幕天天躁日日躁狠狠躁免费| 亚洲va久久久噜噜噜久久0| 天干天干天啪啪夜爽爽99| 国产亚洲精品久久久久动| 中文字幕一区二区三区乱码| 亲子乱子伦xxxx| 欧美黑人巨大久久久精品一区| 国产乱码一区二区| 中文字幕精品一区二区三区在线| 欧美一区二区三区免费播放视频了 | 91午夜在线| 综合久久一区| 午夜影院啪啪| 狠狠躁夜夜躁xxxxaaaa| 日本一区二区三区免费在线| 久久人做人爽一区二区三区小说 | 日本一区二区三区在线视频| 欧美日韩一区免费| 精品a在线| 日本一区二区欧美| 91久久精品久久国产性色也91| 特级免费黄色片| 久久久午夜爽爽一区二区三区三州| 九色国产精品入口| 久久综合伊人77777麻豆| 免费**毛片| 久久精品国产亚洲一区二区| 国产日韩一区在线| 久久精品色欧美aⅴ一区二区| 欧美一级特黄乱妇高清视频| 国产精品女人精品久久久天天| 久久亚洲精品国产日韩高潮| 天干天干天干夜夜爽av| 精品国产1区2区| 欧美精选一区二区三区| 欧美日韩一区电影| 性夜影院在线观看| av素人在线| 中文字幕一区一区三区| 狠狠色噜噜综合社区| 久久福利视频网| 国产区一区| 国产韩国精品一区二区三区| 国产亚洲精品久久久久秋霞 | 黄色av免费| 天啦噜国产精品亚洲精品| 欧美亚洲视频二区| 亚洲欧美日韩精品suv| 在线视频不卡一区| 国产精品6699| 日本一区免费视频| 狠狠色狠狠色很很综合很久久| 午夜黄色大片| 亚洲欧美国产日韩综合| 亚洲美女在线一区| 国产91在线拍偷自揄拍| 欧美3级在线| 欧美乱妇在线视频播放| 欧美精品一卡二卡| 国产精品久久久久久久久久不蜜臀| 国产欧美一区二区三区免费视频| 91一区二区三区在线| 国产激情视频一区二区| 亚洲精品久久久久中文字幕欢迎你 | 午夜影院一区| 色综合久久久| 国产精品乱码一区| 亚洲一二三在线| 亚洲天堂国产精品| 精品国产一区二区在线| **毛片免费| 久久久久亚洲| 视频二区狠狠色视频| 国产在线卡一卡二| 久久中文一区| 国产午夜亚洲精品| 夜夜精品视频一区二区| 91精品资源| 国产精品不卡在线| 国产欧美一区二区在线观看| 亚洲精品久久久久中文第一暮| 李采潭伦理bd播放| 91人人精品| 国产午夜精品一区二区三区最新电影 | 午夜电影毛片| 99国产精品9| 婷婷嫩草国产精品一区二区三区| 国产一级不卡毛片| 7799国产精品久久99| 国产精品一区二区免费| 国产一区不卡视频| 国产91视频一区二区| 亚洲一级中文字幕| 欧美高清性xxxx| 狠狠色丁香久久婷婷综| 亚洲欧美另类综合| 午夜社区在线观看| 99久久国产综合精品麻豆| 7799国产精品久久99| 欧美乱妇高清无乱码| 99久久国产综合精品尤物酒店| 欧美一区二区久久久| 日本中文字幕一区| 国内少妇偷人精品视频免费| 午夜伦理片在线观看| 99视频国产在线| 少妇高潮一区二区三区99小说| 午夜毛片在线| 午夜影院h| 亚洲第一区国产精品| 中文字幕区一区二| 国产清纯白嫩初高生在线播放性色| 91麻豆精品国产91久久久久| 日韩精品久久一区二区|