日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于transformer的長(zhǎng)文本質(zhì)量分析方法在審

專利信息
申請(qǐng)?zhí)枺?/td> 201910583213.4 申請(qǐng)日: 2019-07-01
公開(公告)號(hào): CN110347832A 公開(公告)日: 2019-10-18
發(fā)明(設(shè)計(jì))人: 田文洪;莫中勤;曾柯銘;張朝陽;舒展 申請(qǐng)(專利權(quán))人: 電子科技大學(xué)
主分類號(hào): G06F16/35 分類號(hào): G06F16/35;G06F16/33;G06K9/32;G06K9/62
代理公司: 暫無信息 代理人: 暫無信息
地址: 611731 四川省成*** 國省代碼: 四川;51
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 長(zhǎng)文本 數(shù)據(jù)表征 數(shù)據(jù)分類 質(zhì)量分析 設(shè)計(jì)復(fù)雜度 等級(jí)標(biāo)簽 加權(quán)數(shù)據(jù) 模型分析 數(shù)據(jù)標(biāo)簽 數(shù)據(jù)表示 數(shù)據(jù)采集 數(shù)據(jù)識(shí)別 數(shù)據(jù)特點(diǎn) 數(shù)據(jù)特征 數(shù)據(jù)形式 文本序列 映射 下載 分析 文本 計(jì)算機(jī)
【說明書】:

發(fā)明公開了一種基于transformer的長(zhǎng)文本質(zhì)量分析方法,其主要特點(diǎn)是設(shè)計(jì)了一個(gè)具有長(zhǎng)文本分析能力的方法,克服了目前文本序列訓(xùn)練慢的缺點(diǎn),適應(yīng)數(shù)據(jù)特征的端到端的模型分析方法,其具體步驟包括:數(shù)據(jù)采集,從知網(wǎng)下載畢業(yè)論文;數(shù)據(jù)識(shí)別,提取PDF文本內(nèi)容;數(shù)據(jù)表示,對(duì)文本進(jìn)行處理,映射成計(jì)算機(jī)可分析的數(shù)據(jù)形式;數(shù)據(jù)標(biāo)簽,獲取質(zhì)量等級(jí)標(biāo)簽;數(shù)據(jù)表征,通過設(shè)計(jì)復(fù)雜度相當(dāng)?shù)哪P停M(jìn)行數(shù)據(jù)表征;數(shù)據(jù)分類,根據(jù)數(shù)據(jù)特點(diǎn),加權(quán)數(shù)據(jù)表征的不同特征,進(jìn)行數(shù)據(jù)分類。

技術(shù)領(lǐng)域

本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種基于transformer的長(zhǎng)文本質(zhì)量分析方法。

背景技術(shù)

信息社會(huì)的發(fā)展,維基百科的條目權(quán)威性遭到懷疑,網(wǎng)絡(luò)上海量的XML文本,以及國內(nèi)大量的畢業(yè)論文都存在一定的語句不通、用詞不夠標(biāo)準(zhǔn)、重復(fù)語句過多等質(zhì)量問題,如果再使用人工編輯這將是一個(gè)很大的工作量。

國外維基百科2017年已經(jīng)在對(duì)這一領(lǐng)域提出的一個(gè)基于雙向LSTM的端到端的神經(jīng)網(wǎng)絡(luò)的方法,但文本這種非結(jié)構(gòu)化數(shù)據(jù)比較難以用計(jì)算機(jī)表征,過長(zhǎng)的文本會(huì)導(dǎo)致現(xiàn)有的模型具有梯度消失或者梯度爆炸從而失去提取文本的特征的功能,他們?cè)诰S基百科收集的條目數(shù)據(jù)集下,選擇最長(zhǎng)截取長(zhǎng)度為2000,目前acc值在0.68。

而對(duì)于現(xiàn)有的本科、碩士畢業(yè)論文,文本比維基百科的條目更長(zhǎng),目前現(xiàn)有的設(shè)計(jì)的模型都是針對(duì)300詞左右的短文本的,而對(duì)于像畢業(yè)論文這種幾萬的長(zhǎng)文本,更具有分析難度。本人在長(zhǎng)文本質(zhì)量分析這一塊做了一些工作,CNN模型即可取的中文文本0.92的F1值,但缺點(diǎn)是將長(zhǎng)文本分割成短文本進(jìn)行分析,沒有很好的表征長(zhǎng)文本整體特征。

在2018年前CNN和LSTM是自然語言處理的文本特征的主要提取器,經(jīng)過技術(shù)的不斷發(fā)展tranformer已經(jīng)是目前最優(yōu)的特征提取器,它具有快速計(jì)算、可以并行的特點(diǎn)。

通過上面分析,目前主要問題如下:

現(xiàn)有的自然語言處理模型大多是針對(duì)短文本進(jìn)行分析,缺乏具有長(zhǎng)文本分析能力,會(huì)出現(xiàn)梯度爆炸的問題,影響最終模型的泛化能力;

在的短文本分析中,RNN結(jié)構(gòu)具有訓(xùn)練慢,而應(yīng)用到長(zhǎng)文本這個(gè)問題會(huì)更加放大。

發(fā)明內(nèi)容

為了解決上述至少一個(gè)技術(shù)問題,本發(fā)明主要提供一種基于transformer的長(zhǎng)文本質(zhì)量分析方法,解決長(zhǎng)文本質(zhì)量難以評(píng)估的問題。

一種基于transformer的長(zhǎng)文本質(zhì)量分析方法,包括:數(shù)據(jù)采集,從知網(wǎng)下載畢業(yè)論文;數(shù)據(jù)識(shí)別,提取PDF文本內(nèi)容;數(shù)據(jù)表示,對(duì)文本進(jìn)行處理,映射成計(jì)算機(jī)可分析的數(shù)據(jù)形式;數(shù)據(jù)標(biāo)簽,獲取質(zhì)量等級(jí)標(biāo)簽;數(shù)據(jù)表征,通過設(shè)計(jì)復(fù)雜度相當(dāng)?shù)哪P停M(jìn)行數(shù)據(jù)表征;數(shù)據(jù)分類,根據(jù)數(shù)據(jù)特點(diǎn),加權(quán)數(shù)據(jù)表征的不同特征,進(jìn)行數(shù)據(jù)分類。

進(jìn)一步的,在所述數(shù)據(jù)識(shí)別過程中,利用OCR技術(shù)提取PDF中文本部分的內(nèi)容。

進(jìn)一步的,在所述數(shù)據(jù)表示過程中,將文本進(jìn)行分句、分詞。統(tǒng)計(jì)token詞匯表,將文本映射到詞匯表的索引,并在句子前后分別添加BOS和EOS特殊索引。

進(jìn)一步的,在所述數(shù)據(jù)標(biāo)簽過程中,利用論文上傳時(shí)間,可以提取出論文質(zhì)量等級(jí):優(yōu)、良、差。

進(jìn)一步的,在所述數(shù)據(jù)表征過程中,所述的合適模型分別是:長(zhǎng)文本模型,用于對(duì)論文中正文部分內(nèi)容質(zhì)量進(jìn)行特征提取;短文本模型,用于對(duì)碩士期間研究成果等中、英文論文進(jìn)行特征提取。

進(jìn)一步的,在所述長(zhǎng)文本模型,其具體由transformer特征提取模塊和記憶模塊組成。transformer模塊提取句子特征、記憶模塊進(jìn)行句子特征遺忘和選擇。

進(jìn)一步的,在所述transformer特征提取模塊,其主要由前饋網(wǎng)絡(luò)和self-attention組成:前饋網(wǎng)絡(luò)提取詞向量特征,self-attention提取詞與詞之間的特征。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910583213.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 日韩av一二三四区| 国产日韩精品一区二区| 国产乱人伦精品一区二区| 国产精品亚洲一区二区三区| 香港三日本三级三级三级| 午夜精品一区二区三区在线播放| 99久久免费精品国产男女性高好| 亚洲精品国产精品国自产网站按摩| 午夜叫声理论片人人影院| 国产精品6699| 欧美日韩一区二区三区69堂| 一色桃子av| 国产69精品久久久久男男系列| 免费a级毛片18以上观看精品| 国产精品一区不卡| 久久99中文字幕| 欧美hdxxxx| 娇妻被又大又粗又长又硬好爽| 一区二区三区欧美视频| 少妇久久精品一区二区夜夜嗨 | 蜜臀久久99精品久久一区二区| 日韩精品中文字幕一区二区三区 | 91精彩刺激对白露脸偷拍 | 国产一区二区三区国产| 久久久久国产精品嫩草影院| 国产一级片自拍| 国产精品久久国产精品99| 国产精品国产三级国产播12软件| 久久久久久亚洲精品中文字幕| 国产一区二区片| 国产精品高潮在线| 91精品www| 美女张开腿黄网站免费| 国产一区正在播放| 91国内精品白嫩初高生| 久久国产视屏| freexxxxxxx| 午夜国产一区二区| 农村妇女毛片精品久久| 午夜大片男女免费观看爽爽爽尤物 | 午夜伦全在线观看| 中文av一区| 国产乱色国产精品播放视频| av不卡一区二区三区| 精品久久香蕉国产线看观看gif| 日韩精品一区二区三区在线| 草逼视频网站| 国产视频一区二区在线| xxxxx色| 国产精品高潮呻吟88av| 国产精品1区二区| 亚洲欧美一区二区三区1000| 丝袜诱惑一区二区三区| 欧美网站一区二区三区| 国产一区二区黄| 猛男大粗猛爽h男人味| 国产欧美一区二区三区精品观看| 久久狠狠高潮亚洲精品| 欧美精品中文字幕亚洲专区| 夜色av网| 午夜国产一区| 99国产精品欧美久久久久的广告| 欧美二区精品| 99er热精品视频国产| 91麻豆国产自产在线观看hd| 三级视频一区| 日本福利一区二区| 国产一区二区在线精品| 国产无遮挡又黄又爽免费网站| 欧美激情在线免费| 精品99在线视频| 午夜激情在线免费观看| 国产一区二区二| 亚洲麻豆一区| 国产欧美一区二区三区视频| 国产精品久久久久激情影院| 国产一级一区二区| 26uuu亚洲电影在线观看| 美女直播一区二区三区| 欧美激情在线观看一区| 国产欧美日韩精品一区二区三区 | 91精品免费观看| 国产精品美女www爽爽爽视频| 午夜av影视| 国产床戏无遮挡免费观看网站| 国产午夜亚洲精品午夜鲁丝片| 欧美日韩精品在线播放| 亚洲欧洲精品一区二区三区不卡| 国产欧美一区二区三区在线看| 97国产精品久久| 国产视频一区二区三区四区| 日本看片一区二区三区高清| 狠狠色噜噜狠狠狠色综合| 毛片大全免费看| 91免费视频国产| 国产男女乱淫真高清视频免费| 国产亚洲久久| 中文字幕亚洲欧美日韩在线不卡| 91一区二区三区久久国产乱 | 久久久精品a| 欧美一区二区三区在线免费观看| 亚洲乱码一区二区| 26uuu色噜噜精品一区二区 | 日韩偷拍精品| 国产日韩欧美一区二区在线播放| 日韩精品免费播放| 99久久精品国| 农村妇女毛片精品久久| 国产乱色国产精品播放视频| 99国精视频一区一区一三| 国产精品视频久久| 亚洲精品久久久久玩吗| 国产精品美女久久久免费| 国产男女乱淫真高清视频免费| 思思久久96热在精品国产| 久久天堂国产香蕉三区| 国产精品午夜一区二区三区视频| 国产精品综合在线观看| 片毛片免费看| 17c国产精品一区二区 | 亚洲精品国产91| 国产在线一区二区视频| 亚洲欧美一卡| 91社区国产高清| 欧美激情国产一区| 国产视频二区在线观看| 久久九九国产精品| 日韩精品乱码久久久久久| 久久99精品久久久噜噜最新章节| 99精品国产免费久久| 国产v亚洲v日韩v欧美v片| 亚洲精品久久久久中文字幕欢迎你 | 精品久久一区| 欧美日韩一区二区高清| 国产在线一区观看| 午夜影院一级| 精品国产一区二区三区在线| 91偷拍网站| 美日韩一区| 久久一二区| 日本福利一区二区| 中文字幕制服丝袜一区二区三区| 一区二区在线国产| 国产一区二区视频在线| 国产一区二区资源| 国产一区二区三区小说| 色妞www精品视频| 91精品国产高清一区二区三区 | 91夜夜夜| 一本色道久久综合亚洲精品浪潮| 99精品一区| 97久久超碰国产精品| 国产69精品久久久久999天美| 中文字幕在线播放一区| 久99精品| 午夜免费网址| 国产精品白浆一区二区| 精品久久国产视频| 国产91精品高清一区二区三区| 日韩午夜三级| 国语对白一区二区三区| 思思久久96热在精品国产| 伊人欧美一区| 欧美日韩一区二区三区四区五区六区| 亚洲欧洲另类精品久久综合| 国产第一区在线观看| 亚洲第一天堂无码专区| 国产亚洲精品久久网站| 日韩区欧美久久久无人区| 久久婷婷国产综合一区二区| 亚洲国产美女精品久久久久∴| 精品99在线视频| 在线观看v国产乱人精品一区二区| 国产精品一区二区三区在线看| 欧美日本三级少妇三级久久| 欧美69精品久久久久久不卡| 午夜在线观看av| 特高潮videossexhd| 浪潮av色| 久久aⅴ国产欧美74aaa| 福利片91| 99久久国产综合精品麻豆| 草逼视频网站| 91精品国产麻豆国产自产在线| 少妇高潮在线观看| 国内精品久久久久影院日本| 亚洲少妇中文字幕| 精品国产一区二区三区免费 | 久久精品99国产国产| 日韩国产不卡| 色偷偷一区二区三区| 国产一区影院| 久久一区欧美| 国模少妇一区二区三区 | 欧美精品九九| 久久激情综合网| 狠狠色依依成人婷婷九月| 99久久国产综合精品女不卡| 年轻bbwwbbww高潮| 久久久久久综合网| 国产午夜一区二区三区| 国产欧美一区二区精品性色超碰| 日韩精品少妇一区二区在线看| 国产一区二区伦理片| 丰满岳妇伦4在线观看| 亚洲国产一区二区久久久777| 欧美系列一区二区| 久久免费福利视频| 国产精品国产三级国产播12软件 | 午夜色影院| 日本一二三区视频在线| 小萝莉av| 羞羞视频网站免费| 欧美日韩精品在线一区| 岛国黄色av| 精品国产91久久久久久久| 狠狠色噜噜狠狠狠狠米奇777| 日韩电影在线一区二区三区| 国产一区二区三区精品在线| 91精品黄色| 九九国产精品视频| 亚洲精品久久久中文| 国产在线视频99| 国产精品视频久久久久| 欧美一区二区三区不卡视频 | 99精品少妇| 亚洲伊人久久影院| 性欧美一区二区| 国产88av| 日韩偷拍精品| 国产乱淫精品一区二区三区毛片| 91精品一二区| 国产三级国产精品国产专区50| 亚洲精品卡一卡二| 热re99久久精品国99热蜜月| 91精品丝袜国产高跟在线| 国产精品久久久爽爽爽麻豆色哟哟| 亚洲欧美一卡| 欧美激情精品久久久久久免费| 欧美三区二区一区| 四虎国产永久在线精品| 中文字幕制服狠久久日韩二区| 国产一区二区三区久久久| 日本aⅴ精品一区二区三区日| 国产99久久久国产精品免费看| 午夜666|