日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于BERT和Word2Vec向量融合的中文實(shí)體識(shí)別方法在審

專利信息
申請(qǐng)?zhí)枺?/td> 202011462808.3 申請(qǐng)日: 2020-12-14
公開(kāi)(公告)號(hào): CN112632997A 公開(kāi)(公告)日: 2021-04-09
發(fā)明(設(shè)計(jì))人: 張有強(qiáng) 申請(qǐng)(專利權(quán))人: 河北工程大學(xué)
主分類號(hào): G06F40/295 分類號(hào): G06F40/295;G06F40/30
代理公司: 廈門一創(chuàng)聯(lián)智知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 35252 代理人: 李燕麗
地址: 056000 河北省*** 國(guó)省代碼: 河北;13
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 基于 bert word2vec 向量 融合 中文 實(shí)體 識(shí)別 方法
【權(quán)利要求書】:

1.一種基于BERT和Word2Vec向量融合的中文實(shí)體識(shí)別方法,其特征在于,利用BERT模型獲取句子中每個(gè)字的動(dòng)態(tài)字向量,利用Word2Vec獲取靜態(tài)詞向量,通過(guò)設(shè)計(jì)的兩種融合策略對(duì)多個(gè)候選詞向量進(jìn)行融合,然后與字向量拼接,輸入到Bi-LSTM-CRF進(jìn)行模型訓(xùn)練,自動(dòng)抽取文本中指定類型的實(shí)體。

2.根據(jù)權(quán)利要求1所述的一種基于BERT和Word2Vec向量融合的中文實(shí)體識(shí)別方法,其特征在于,所述中文實(shí)體識(shí)別方法具體包括以下步驟:

步驟1,獲取海量中文文本并進(jìn)行預(yù)處理,利用Python中的jieba模塊對(duì)文本進(jìn)行分詞,訓(xùn)練Word2Vec模型,獲取靜態(tài)詞向量表;

步驟2,對(duì)BERT模型進(jìn)行預(yù)訓(xùn)練,把中文文本構(gòu)造成BERT模型需要的輸入格式,具體分為以下幾步:

2.1對(duì)于原始語(yǔ)料,通過(guò)換行來(lái)分割句子,通過(guò)空行來(lái)分割上下文段落;

2.2構(gòu)建BERT下一句預(yù)測(cè)預(yù)訓(xùn)練任務(wù)需要的樣本,其中正樣本表示的是輸入的兩個(gè)句子是存在上下文關(guān)系的連續(xù)的兩個(gè)句子;負(fù)樣本表示的是不存在語(yǔ)義關(guān)系的隨機(jī)選擇的兩個(gè)句子;

2.3對(duì)于超過(guò)設(shè)定的最大長(zhǎng)度的句子,隨機(jī)選擇從句首或句尾進(jìn)行截?cái)啵?/p>

2.4將待輸入的兩個(gè)句子用[SEP]標(biāo)簽連接,并且在整個(gè)句首添加[CLS]標(biāo)簽,整個(gè)句尾添加[SEP]標(biāo)簽;

2.5構(gòu)建BERT遮蔽語(yǔ)言模型預(yù)訓(xùn)練任務(wù)需要的樣本,隨機(jī)選擇句子中15%的字符進(jìn)行遮蔽,對(duì)于選中的字符80%的時(shí)間用[MASK]代替,10%的時(shí)間用隨機(jī)選擇的一個(gè)字符代替,10%的時(shí)間保持原字符不變;

步驟3,根據(jù)上述兩個(gè)預(yù)訓(xùn)練任務(wù)訓(xùn)練BERT模型,訓(xùn)練目標(biāo)分別是預(yù)測(cè)當(dāng)前輸入的句子對(duì)是否是存在上下文關(guān)系的句子和預(yù)測(cè)被遮蔽掉字符的原始內(nèi)容,最終獲得預(yù)訓(xùn)練好的BERT模型;

步驟4,中文命名實(shí)體識(shí)別數(shù)據(jù)集的獲取、預(yù)處理以及標(biāo)注,具體標(biāo)注方式一般采用BIO標(biāo)注法,其中B表示實(shí)體開(kāi)始字符,I表示實(shí)體中間和結(jié)尾字符,O表示非實(shí)體字符;

步驟5,將步驟4得到的標(biāo)注好的數(shù)據(jù)集進(jìn)行預(yù)處理,給每一個(gè)句子的句首添加[CLS]標(biāo)簽,句尾添加[SEP]標(biāo)簽,將處理好的句子輸入步驟3預(yù)訓(xùn)練好的BERT模型,獲取BERT模型輸出的句子中每一個(gè)字符的字向量;

步驟6,對(duì)步驟4得到的數(shù)據(jù)集中的每一個(gè)句子,通過(guò)與詞匯表匹配的方式獲取該句子包含的所有候選詞語(yǔ)的詞向量,將句子中每個(gè)字對(duì)應(yīng)的候選詞向量通過(guò)兩種詞向量融合策略進(jìn)行融合,來(lái)表示每個(gè)字在詞匯層面的語(yǔ)義含義,具體包含以下兩種融合策略:

6.1詞向量融合策略一:對(duì)句子中每個(gè)字的候選詞向量進(jìn)行求和取均值,以“廣州市長(zhǎng)隆公園”句子為例,“廣”字包含“廣州”和“廣州市”兩個(gè)匹配的候選詞語(yǔ),首先查詢?cè)~向量表獲得兩個(gè)詞語(yǔ)的詞向量,然后對(duì)兩個(gè)詞向量求和取均值作為“廣”字的詞向量表示部分。

6.2詞向量融合策略二:對(duì)句子中每個(gè)字的候選詞向量以詞頻作為權(quán)重進(jìn)行加權(quán)求和,同樣以上述例子為例,首先統(tǒng)計(jì)“廣州”和“廣州市”在數(shù)據(jù)集中出現(xiàn)的總次數(shù),然后將兩個(gè)詞出現(xiàn)的次數(shù)分別除以兩個(gè)詞的總次數(shù)作為兩個(gè)詞向量的權(quán)重,最后將權(quán)重和詞向量相乘并求和作為“廣”字的詞向量表示部分,其余字符同理,當(dāng)某個(gè)字不存在候選詞語(yǔ)時(shí),用[None]的詞向量表示該字的詞向量部分,維度同其他詞向量維度一樣。

步驟7,將步驟6得到的每個(gè)字的詞向量與步驟5得到的每個(gè)字的字向量進(jìn)行拼接,獲得每個(gè)字符的最終字向量;

步驟8,將步驟7得到的字向量輸入Bi-LSTM-CRF模型進(jìn)行訓(xùn)練預(yù)測(cè),獲得實(shí)體識(shí)別結(jié)果。

3.根據(jù)權(quán)利要求2所述的一種基于BERT和Word2Vec向量融合的中文實(shí)體識(shí)別方法,其特征在于,步驟1、2中所述的中文文本預(yù)處理主要包括將通過(guò)爬蟲或其他途徑獲取的文本數(shù)據(jù)去除無(wú)用符號(hào)、重復(fù)數(shù)據(jù)以及規(guī)范數(shù)據(jù)格式等。

4.根據(jù)權(quán)利要求3所述的一種基于BERT和Word2Vec向量融合的中文實(shí)體識(shí)別方法,其特征在于,所述步驟2中,對(duì)于長(zhǎng)度不夠的句子需要用[PAD]標(biāo)簽進(jìn)行補(bǔ)齊,最終將定長(zhǎng)句子輸入BERT模型進(jìn)行訓(xùn)練。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于河北工程大學(xué),未經(jīng)河北工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011462808.3/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产精品伦一区二区三区视频| 久久免费视频一区| 国产精品久久久久久亚洲调教| 一区精品二区国产| av午夜影院| 17c国产精品一区二区| 91夜夜夜| 伊人久久婷婷色综合98网| 九九国产精品视频| 91麻豆产精品久久久| 国产真实一区二区三区| 国产经典一区二区| 精品国产一区二区三区国产馆杂枝| 91精品资源| 国产精品一区二区中文字幕| 国产精品久久久久久久久久嫩草| 97国产精品久久| 国内久久精品视频| 亚洲麻豆一区| 国产精品久久久麻豆| 国产乱老一区视频| 91久久精品在线| 国产亚洲精品精品国产亚洲综合| 国产欧美日韩va另类在线播放| 日本二区在线播放| 中文丰满岳乱妇在线观看| 欧美日韩乱码| 日韩一级片在线免费观看| 88国产精品欧美一区二区三区三| 亚洲国产精品二区| 日韩一区二区中文字幕| 在线视频不卡一区| 国产美女视频一区二区三区| 91精品中综合久久久婷婷| 国产精品一二三区视频网站| 国产白嫩美女在线观看| 精品国产一区二区三| 性生交片免费看片| 综合色婷婷一区二区亚洲欧美国产| 国产精品日韩精品欧美精品| 国产色99| 一区二区三区欧美在线| 97精品久久人人爽人人爽| 国产午夜亚洲精品| 一区二区久久久久| 国产精品一区二区在线看| 香蕉av一区| 国产真实一区二区三区| 精品少妇一区二区三区免费观看焕| 夜夜躁日日躁狠狠久久av| 亚洲欧美日韩综合在线| 69精品久久| av毛片精品| 久久网站精品| 欧洲精品一区二区三区久久| 国产精品自产拍在线观看桃花| 国产欧美日韩va另类在线播放| 久久精品99国产国产| 99久精品视频| 精品一区中文字幕| 97视频一区| 久久久久久久久亚洲精品| 国产精品一区在线播放| 四虎国产精品久久| 精品国产乱码久久久久久免费| 国产精品九九九九九九九| 国产日韩精品久久| 国产精品久久久久久久久久嫩草| 国产午夜精品免费一区二区三区视频 | av午夜在线| 欧美资源一区| 国产91刺激对白在线播放| 精品国产一区二区三区忘忧草| 日本一区二区三区电影免费观看| 国产视频一区二区视频| 欧美日韩乱码| 精品91av| 激情久久久| 国产欧美久久一区二区三区| 性夜影院在线观看| 欧美日韩精品不卡一区二区三区| 久久国产麻豆| 欧美极品少妇xx高潮| 国产欧美视频一区二区三区| 欧美日韩精品在线一区二区| 999国产精品999久久久久久| 久久国产欧美一区二区三区精品| 欧美日韩一级二级三级| 亚日韩精品| 国产精品久久久久久久四虎电影| 波多野结衣女教师电影| 亚洲欧美色图在线| 国产乱xxxxx97国语对白| 处破大全欧美破苞二十三| 国产精品6699| 91精品福利观看| 老女人伦理hd| 国产精品日韩高清伦字幕搜索| 国产一区二区极品| 鲁丝一区二区三区免费| 亚洲乱码一区二区三区三上悠亚| 国产精品6699| 精品国产鲁一鲁一区二区作者| 99精品一级欧美片免费播放| 99久久国产综合精品色伊| 国产剧情在线观看一区二区| 欧美精品乱码视频一二专区| 8x8x国产一区二区三区精品推荐| 国产一区二区在线免费| 偷拍自中文字av在线| 欧美高清一二三区| 久99久精品| 久久久久久中文字幕| 麻豆91在线| 亚洲精品丝袜| 国产欧美日韩综合精品一| 蜜臀久久99静品久久久久久| 搡少妇在线视频中文字幕| 一二三区欧美| 欧美一区二区色| 高清欧美精品xxxxx| 国产真实一区二区三区| 999亚洲国产精| www.日本一区| 中文字幕一区2区3区| 99精品国产一区二区三区麻豆 | 激情aⅴ欧美一区二区三区| 久久国产欧美日韩精品| 国产69精品久久99不卡解锁版 | 正在播放国产一区二区| 日本午夜影视| 国产一区亚洲一区| 国产午夜精品一区理论片飘花| 日韩精品中文字幕一区| 免费91麻豆精品国产自产在线观看| 野花社区不卡一卡二| 日韩无遮挡免费视频| 国产在线拍偷自揄拍视频| 久久久久久综合网| 久久国产精品波多野结衣| 一区二区三区毛片| 欧美日韩精品影院| 狠狠躁狠狠躁视频专区| 亚洲国产精品激情综合图片| 亚洲一区二区福利视频| 国产区二区| 狠狠色噜噜狠狠狠狠777| 九九视频69精品视频秋欲浓| 日韩av在线资源| 国产午夜精品一区二区三区四区 | 在线国产精品一区二区| 欧美日韩精品在线播放| 欧美精品亚洲一区| 久久久精品观看| 少妇又紧又色又爽又刺激视频网站| 猛男大粗猛爽h男人味| 欧美一区二区精品久久| 欧洲精品一区二区三区久久| 国产黄一区二区毛片免下载 | www亚洲精品| 91福利视频免费观看| 国产免费一区二区三区四区| 午夜影院一级| 91一区二区在线观看| 久精品国产| 国产一区二区手机在线观看| 国产精品色婷婷99久久精品| 99久久夜色精品| 欧美一级久久久| 91视频国产九色| 日韩美一区二区三区| 日韩av中文字幕在线免费观看| 久久96国产精品久久99软件| 国产欧美日韩一级| 99久久婷婷国产亚洲终合精品| 国产精品免费不卡| 自拍偷在线精品自拍偷无码专区| 国产精一区二区三区| 国产高清在线观看一区| 在线亚洲精品| 欧美日韩一区不卡| 国产一区=区| 国产一区日韩一区| 午夜裸体性播放免费观看| 中文字幕av一区二区三区高| 99三级视频| 91精品视频一区二区| 久久综合二区| 欧美一区二区三区激情| 国内偷拍一区| 狠狠色噜狠狠狠狠| 日本大码bbw肉感高潮| 国产一区日韩在线| 国产亚洲综合一区二区| 一本一道久久a久久精品综合蜜臀| 国产1区2区视频| 国产精品一区二区6| 夜夜爽av福利精品导航| 国产一区二区三区黄| 青苹果av| 午夜肉伦伦影院九七影网| 日本精品99| 久久国产视屏| 国产天堂第一区| 国产一区二区伦理| 国产精品久久久久久久久久嫩草| 一色桃子av大全在线播放| 欧美一区久久| 国产一区欧美一区| 亚洲va国产| 国产在线不卡一| 国产在线一卡| 999久久久国产| 人人玩人人添人人澡97| 99久久久久久国产精品| 国产全肉乱妇杂乱视频在线观看| 国产一区二区91| 午夜大片网| 国产69精品久久久久孕妇不能看| 狠狠色噜噜狠狠狠狠2021天天| 在线亚洲精品| 国产jizz18女人高潮| 91制服诱惑| 夜夜爽av福利精品导航| 少妇厨房与子伦在线观看| 久久综合狠狠狠色97| 国产偷国产偷亚洲清高| 国产午夜亚洲精品羞羞网站| 国内久久久| av素人在线| 欧美大片一区二区三区| 夜夜夜夜曰天天天天拍国产 | 亚洲一区二区福利视频| xxxx国产一二三区xxxx| 亚洲国产精品一区二区久久,亚洲午夜| 日韩精品一区二区三区免费观看| 韩漫无遮韩漫免费网址肉| 欧美高清性xxxxhd| 国产一区二区二| 久久久久亚洲| 国产欧美性| 国产精选一区二区| 日本美女视频一区二区三区| 国产精品久久久久久久久久久新郎| 96精品国产| 99久精品视频|