日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于實體替換的文本分類方法有效

專利信息
申請號: 202011131161.6 申請日: 2020-10-21
公開(公告)號: CN112215000B 公開(公告)日: 2022-08-23
發明(設計)人: 劉洪濤;章家涵 申請(專利權)人: 重慶郵電大學
主分類號: G06F40/289 分類號: G06F40/289;G06F40/295;G06F40/30;G06N3/04;G06F16/35
代理公司: 重慶市恒信知識產權代理有限公司 50102 代理人: 陳棟梁
地址: 400065 重*** 國省代碼: 重慶;50
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 實體 替換 文本 分類 方法
【權利要求書】:

1.一種基于實體替換的文本分類方法,其特征在于,包括以下步驟:

S1:利用外部知識庫檢測出文檔中的錨定短語并查詢每個錨定短語對應的實體集合;

S2:將文檔詞向量獲得的實體集合來求嵌入矩陣求平均,得到文檔的上下文向量;

S3:分別計算各錨定短語對應實體在文檔上下文表示向量下的注意力權重,得到各實體的去歧向量;

S4:將原文位置上的實體替換為去歧實體向量并輸入長短時記憶網絡,得到去歧后的文檔表示向量,并將去歧后的文檔表示向量輸入到神經網絡的全連接層,使用分類器計算各文本屬于各類別的概率來訓練網絡;

S5:利用訓練好的模型預測待預測文本所屬類別,取概率最大的類別作為預測的類別輸出;

所述步驟S1中,利用外部知識庫檢測出文檔中的錨定短語并查詢每個錨定短語對應的實體集合,包括以下步驟:

S11:定義“實體”為知識庫中確定,無歧義的對象;“錨定短語”為字面形式的文字,一個錨定短語可對應多個實體,一個實體也可以由多個錨定短語來表示;

S12:在外部資料庫Wikipedia中收集所有的錨定短語,對于每一個錨定短語s,將所有與其有連接的實體{e1,e2,...eK}作為它的實體字典,所有的錨定短語與其實體字典共同構成Wikipedia字典;

S13:抽取出文檔T中所有n-grams短語(n≤k),n-grams短語指由n個詞構成的短語,如果一個n-grams可以在Wikipedia字典中作為錨定短語存在,并且有至少兩個對應的實體,那么就把這個n-grams加入候選錨定短語,對于有矛盾覆蓋的n-grams短語,采取“最先最長”的方法,即選取最長的最先出現的n-grams短語,一個文檔中的所有錨定短語表示為:

U(T)={c1,c2,...}

第i個錨定短語對應的實體集合表示為:

E(ci)={e1,e2,...};

所述步驟S2中,將文檔詞向量求平均,得到文檔的上下文向量,包括以下步驟:

S21:使用Wikipedia2Vec工具進行預訓練,得到單詞和實體的嵌入矩陣,令文檔中第i個詞的詞向量表示x是d維向量,表示d維空間,d表示維度數,文檔長度為n,則句子表示為:

x1:n=[x1;x2;...;xn]

S22:對文檔T,將詞向量求平均,得到文檔的上下文向量,計算公式如下:

其中,C為文檔的上下文向量;

所述步驟S3中,分別計算各錨定短語對應實體在文檔上下文表示向量下的注意力權重,得到各錨定短語的去歧向量,包括以下步驟:

S31:借助步驟S21中Wikipedia2Vec工具預訓練的嵌入矩陣,得到步驟S1中匹配到的實體對應的向量表示,令文檔中第i個錨定短語對應的第j個實體向量

S32:對于每個錨定短語,計算其對應的實體向量在步驟S2中得到的上下文表示向量下的注意力權重,然后對實體向量加權求和,得到各錨定短語的去歧向量,計算公式如下:

其中,αij為文檔第i個錨定短語對應的第j個實體在上下文C下的注意力權重,v為文檔第i個錨定短語對應實體的個數,zi為文檔第i個錨定短語的去歧向量;

所述步驟S4中,將原文位置上的實體替換為去歧實體向量并輸入長短時記憶網絡,得到去歧后的文檔表示向量,并將其輸入到神經網絡的全連接層,使用分類器計算各文本屬于各類別的概率來訓練網絡,包括以下步驟:

S41:將原文檔的錨定短語替換為步驟S3所得的對應去歧向量,則文檔可表示為T=[x1;...;z1;...;zv;...;xn],zv表示最后一個去歧向量,xn表示最后一個原文詞向量,為方便描述,記為[l1;...;lr],其中r為替換后所含向量數目;

S42:對于文檔T,將詞向量和去歧向量按照順序依次輸入到一個雙向的長短時記憶網絡中,對于長短期記憶網絡的正向,依次輸入l1,...,lr,對于長短期記憶網絡的反向,則依次輸入lr,...,l1;計算每個詞在正向和反向的隱層狀態值,將這些隱層狀態值求和,得到最終去歧后的文檔表示向量,計算公式如下:

其中,li為文檔表示中第i個向量,f為長短時記憶網絡中隱層狀態計算函數,表示文檔中第i個向量在正向長短時記憶網絡中的隱層狀態向量,表示文檔中第i個向量在反向長短時記憶網絡中的隱層狀態向量,o為文檔的去歧向量;

S43:將文檔的去歧向量輸入到全連接層,并使用softmax歸一化,計算文檔屬于各類別的概率,最后以對數似然函數為損失函數,通過隨機梯度下降,利用反向傳播迭代更新模型參數,以最小化損失函數來訓練模型,計算公式如下:

p=softmax(Wco+bc)

其中,Wc為全連接層權重矩陣,bc為偏置項,softmax是歸一化操作,p為文檔屬于各個類別的概率,x為訓練集中的文檔,y為其真實類別標簽,θ為模型參數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011131161.6/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 亚洲精品国产setv| 狠狠色噜狠狠狠狠| 欧美一区亚洲一区| 国产精品一区二区av麻豆| 国产真实乱偷精品视频免| 欧美在线观看视频一区二区 | 欧美日韩激情一区二区| 国产精品爽到爆呻吟高潮不挺| 国产日韩精品一区二区三区| 99精品视频一区二区| 国产精品视频1区| 久久精品视频偷拍| 亚洲精品一区中文字幕| 日本看片一区二区三区高清| 欧美一区二粉嫩精品国产一线天| 国产精品日韩电影| 色综合久久综合| 91麻豆精品国产91久久久久| 欧美3p激情一区二区三区猛视频 | 国产理论片午午午伦夜理片2021| 在线国产二区| 国产精品69av| 91麻豆精品国产91久久久更新时间| 亚洲一区欧美| 午夜看片网| 91麻豆精品国产91久久久无限制版| 国产精品视频一区二区三| 国语对白一区二区| 国产一区网址| 中文字幕a一二三在线| 首页亚洲欧美制服丝腿| 亚洲国产精品二区| 国产91丝袜在线熟| 欧美一区二区三区精品免费| 午夜精品一区二区三区三上悠亚 | 高清欧美xxxx| 欧美大片一区二区三区| 国产一区在线免费观看| 国产精品自产拍在线观看蜜| 日韩中文字幕在线一区二区| 中文字幕一区二区三区四| 国产在线拍偷自揄拍视频| 九九久久国产精品| 精品国产一二三四区| 欧美精品日韩精品| 日韩一区二区中文字幕| 国产白丝一区二区三区| 日韩亚洲国产精品| 91久久国产露脸精品国产| 亚洲国产欧美一区| 欧美日韩一区二区电影| 中文字幕+乱码+中文字幕一区| 国产第一区二区三区| 国产一区二区三区大片| 亚洲精品国产一区二区三区| 免费午夜在线视频| 久久久综合亚洲91久久98| 高清欧美xxxx| 欧美日韩国产一区二区三区在线观看| 91精品福利观看| 久久中文一区| 国产在线拍揄自揄拍| 又色又爽又大免费区欧美| 久久99精品国产| 亚洲乱亚洲乱妇50p| 99国产精品永久免费视频 | 欧美在线播放一区| 亚洲精品中文字幕乱码三区91| 蜜臀久久99精品久久一区二区| 国产性猛交| 欧美日韩一区二区电影| 热99re久久免费视精品频软件| 国产一区二区三区网站| 91嫩草入口| 日韩av在线资源| 亚洲精品国产综合| 狠狠色噜噜狠狠狠狠综合久| 国产精品乱码一区| 久久99中文字幕| 国产一区免费播放| 激情久久综合| 九色国产精品入口| 欧美日韩一级二级三级| 久久精品com| xxxx国产一二三区xxxx| 国产网站一区二区| 亚洲精品国产主播一区| 国产馆一区二区| 午夜电影一区| 久久国产欧美日韩精品| 91丝袜诱惑| 538国产精品| av国产精品毛片一区二区小说| 色吊丝av中文字幕| 一区二区三区四区中文字幕| 国产精品日韩在线观看| 好吊妞国产欧美日韩免费观看网站| 日韩欧美高清一区| 99久久免费精品国产男女性高好| 91亚洲欧美日韩精品久久奇米色| 国产伦精品一区二区三区照片91| 少妇久久精品一区二区夜夜嗨 | 午夜av男人的天堂| 午夜av片| 97涩国一产精品久久久久久久| 国产日产欧美一区二区| 中文乱幕日产无线码1区| 国产极品一区二区三区| 乱淫免费视频| 国产视频1区2区| 中文字幕av一区二区三区高| 浪潮av网站| 99久久国产综合| 97国产婷婷综合在线视频,| 国产电影一区二区三区下载| 538国产精品一区二区免费视频| 日本一区二区三区在线看| 国产日韩欧美综合在线| 91麻豆精品国产91久久| 欧美乱战大交xxxxx| 午夜av影视| 亚洲一二三在线| 久久狠狠高潮亚洲精品| 久久精品—区二区三区| 午夜老司机电影| 国产精品久久久久免费a∨大胸| 亚洲网站久久| 中文字幕视频一区二区| 国产麻豆91欧美一区二区| 亚洲午夜久久久久久久久电影院| 91波多野结衣| 麻豆视频免费播放| 日韩精品免费一区| 国产一卡在线| 日本午夜无人区毛片私人影院| 午夜伦理片在线观看| 精品国产一区二区三区忘忧草| 亚洲w码欧洲s码免费| 91久久精品国产亚洲a∨麻豆 | 欧美一区二区三区日本| 亚洲精品一区,精品二区| 日韩亚洲精品在线| 国产亚洲精品久久久久久网站| 国产精品天堂网| 久久99精品久久久噜噜最新章节| 17c国产精品一区二区| 精品国产精品亚洲一本大道| 91av中文字幕| 精品国精品国产自在久不卡| 夜夜夜夜夜猛噜噜噜噜噜gg| 久久国产欧美一区二区三区精品| 欧美精品一区二区久久久| 国产日韩欧美色图| 一区二区中文字幕在线| 亚洲欧美精品suv| 国产不卡网站| 欧美精品日韩| 91精品一二区| 国产资源一区二区| 少妇久久精品一区二区夜夜嗨| 一区二区三区欧美日韩| 精品一区二区超碰久久久| 国产乱一乱二乱三| 国产偷国产偷亚洲清高| 国产色99| 国产精品视频免费一区二区| 夜夜爱av| 日韩一区二区精品| 欧美精品亚洲一区| 国产99网站| 午夜生活理论片| 久久二区视频| 2020国产精品自拍| 国产一区在线免费| 国产精品无码永久免费888| 精品视频久| 亚洲乱小说| 亚洲欧美日韩国产综合精品二区| 国产精品9区| 国产一区日韩欧美| 久久综合激情网| 国产在线不卡一区| 自拍偷在线精品自拍偷无码专区| 午夜影院你懂的| 日韩精品中文字幕久久臀| 欧美日韩一区二区电影| 国内久久久| 偷拍久久精品视频| 午夜三级电影院| 欧美xxxxhdvideos| 国内视频一区二区三区| 国产日韩欧美第一页| 日本xxxx护士高潮hd| 日韩中文字幕一区二区在线视频| 国产一二区在线观看| 日本一二三四区视频| 2020国产精品自拍| 国产性猛交| 在线观看欧美日韩国产| 国产欧美一区二区三区在线看| 日韩精品一区在线观看| 国内精品国产三级国产99| 午夜a电影| 91精品国产麻豆国产自产在线| 色噜噜狠狠狠狠色综合久| 国产日韩欧美专区| 91看片淫黄大片91| 欧美精品九九| 欧美三级午夜理伦三级老人| 国产一区二区a| 午夜影院你懂的| 国产视频在线一区二区| 午夜激情在线| 大bbw大bbw巨大bbw看看| 国内少妇偷人精品视频免费| 久久激情图片| 欧美二区精品| 99久久夜色精品| 国产中文字幕91| 久久艹国产精品| 中文字幕一级二级三级| 国产精品对白刺激在线观看| 狠狠插狠狠爱| 亚洲国产一区二区久久久777| 精品videossexfreeohdbbw| 欧美一区二三区| 国产精品视频1区| 午夜av免费观看| 99精品少妇| 午夜叫声理论片人人影院| 日韩精品免费播放| 国产精品视频久久久久久| 少妇在线看www| 欧美777精品久久久久网| 国产一区二区三区伦理| 日韩欧美高清一区| 午夜电影一区| 国产精品久久久久久一区二区三区 | 69精品久久| 老太脱裤子让老头玩xxxxx| 天堂av色婷婷一区二区三区| 欧美大片一区二区三区| 国产精品二区在线| 国产伦精品一区二区三区免| 日韩国产精品一区二区| 一区二区91|