日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種在深度語言模型中融入額外知識信息的方法在審

專利信息
申請號: 202010410674.4 申請日: 2020-05-15
公開(公告)號: CN111666374A 公開(公告)日: 2020-09-15
發明(設計)人: 楊燕;鄭淇;陳成才;賀樑 申請(專利權)人: 華東師范大學;上海智臻智能網絡科技股份有限公司
主分類號: G06F16/33 分類號: G06F16/33;G06F16/332;G06F16/35;G06F40/211;G06F40/295;G06F40/30
代理公司: 上海藍迪專利商標事務所(普通合伙) 31215 代理人: 徐筱梅;張翔
地址: 200241 *** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 深度 語言 模型 融入 額外 知識 信息 方法
【說明書】:

發明公開了一種在深度語言模型中融入額外知識信息的方法,其特點是采用將知識信息融入到深度語言模型中進行預訓練的方法,通過大規模自然語言語料上進行實體標注,并對自然語言文本進行實體級別的擾動構造負樣本用以強化和提升知識庫問答系統中關系匹配模塊的性能,模型的訓練和知識融入具體包括:構建詞表、識別實體信息、創建訓練所需的負樣本和預訓練深度語言模型步驟。本發明與現有技術相比具有將結構化知識信息引入深度語言模型的參數中,使得模型具備針對自然語言輸入文本進行包含事實性結構化信息的語義理解,在對應任務上獲得性能提升,方法簡便,效率高。

技術領域

本發明涉及計算機問答系統技術領域,尤其是一種基于知識圖譜在深度語言模型中融入額外知識信息的方法。

背景技術

自然語言處理旨在研究使用計算機自動處理、理解與生成自然語言的技術。問答系統是自然語言處理中的一個重要的子領域,旨在針對用戶輸入的問題通過計算機自動給出回答。問答系統分為多種類型,包括基于閱讀理解的問答系統,基于社區檢索的問答系統以及基于知識庫的問答系統;基于閱讀理解的問答系統通過在給定的文章片段中搜索潛在的答案來回答相關的問題;基于社區檢索的問答系統通過一個檢索系統查詢社區中可能相關的回答或者文本片段,并對所有的候選回答根據上下文與給定信息進行重排序來回答用戶輸入的問題;以及基于知識庫的問答系統通過在一個給定的知識庫中確定檢索子圖查詢范圍并且在子圖中搜索最為相關的實體,將這些候選實體作為針對問題的事實性回答返回給用戶。

知識庫是指將一系列事實等信息通過結構化存儲方法保存的數據庫。一般情況下,這些事實信息通過“實體-謂詞-實體”的三元組形式保存。不同的實體之間通過各種關系謂詞相互連接,形成了一種網狀的圖結構為知識圖譜。知識庫在多個領域有著廣泛的應用,在自然語言處理領域,常常通過引入知識庫來在編碼器階段引入額外的事實性信息,從而提高神經網絡在自然語言處理任務上的性能。

近年來,BERT、ELMo等深度語言模型極大地影響了自然語言處理領域的模型設計。這些深度語言模型的特點是擁有極大的參數量,同時有著數目龐大的預訓練語料,通過語言模型等無監督任務來自動編碼自然語言中潛藏的語法與語義信息。以BERT為例,BERT使用了12層768維度隱層的Transformer模型作為其編碼器,并通過從互聯網多個來源爬取的上千萬條篇章語料信息構建訓練集合。由深度學習獲得的詞語向量表示含有豐富的上下文信息于語義信息,有著強大的表示能力,而與之相對的傳統詞向量并沒有上下文信息以及龐大的語料信息,需要在對應數據集中輸入一個額外的編碼器進行微調才可獲得理想的性能。深度語言模型的應用極大地提升了自然語言處理中多個子任務的準確率,顯著改進了自然語言模型對語言的理解能力。

現有技術的深度語言模型大多使用自然語言語料作為其訓練集,存在著缺乏結構化知識庫信息的問題,當遇到需要事實性信息的任務時,這些深度語言模型會因為缺乏結構化知識信息而出現性能不佳的情形。

發明內容

本發明的目的是針對現有技術不足而提供的一種在深度語言模型中融入額外知識信息的方法,采用將結構化知識信息融入深度語言模型的預訓練方法,用以強化知識庫問答系統中關系匹配模塊性能,通過在大規模自然語言語料上進行實體標注,并對自然語言文本進行實體級別的擾動構造負樣本,將結構化知識信息引入深度語言模型的參數中,使得模型具備針對自然語言輸入文本進行包含事實性結構化信息的語義理解,在對應任務上獲得性能提升,方法簡便,效率高。

實現本發明目的具體技術方案是:一種在深度語言模型中融入額外知識信息的方法,其特點是采用將知識信息融入到深度語言模型中進行預訓練的方法,強化知識庫問答系統中關系匹配模塊的性能,其模型的具體訓練和知識融入包括以下步驟:

1)構建實體到指稱的詞表;

2)通過構建的詞表識別文本中的實體信息;

3)對自然語言文本進行擾動,創建訓練所需的負樣本;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學;上海智臻智能網絡科技股份有限公司,未經華東師范大學;上海智臻智能網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010410674.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 狠狠躁狠狠躁视频专区| 欧美精品久久一区| 国产精品一区二区在线观看| 亚洲欧美国产一区二区三区| 国产精品久久久久久久龚玥菲| 夜夜精品视频一区二区| 色噜噜狠狠色综合久| 欧美日韩一卡二卡| 欧美性受xxxx狂喷水| 99riav3国产精品视频| 精品99在线视频| 亚洲久色影视| 国产精品九九九九九九九| 91波多野结衣| 在线视频不卡一区| 午夜影院激情| 国产全肉乱妇杂乱视频在线观看| 亚洲国产精品二区| 亚洲国产精品综合| 玖玖精品国产| 国产69精品久久久久孕妇不能看 | 国产欧美日韩va另类在线播放| 欧美国产一区二区在线| 91麻豆精品一区二区三区| 日本精品三区| 特高潮videossexhd| 日韩欧美中文字幕一区| 国产97在线看| 欧美日韩亚洲三区| 久久综合久久自在自线精品自| 国产精品国产一区二区三区四区| 久久97国产| 国产精品视频99| 中文字幕日韩精品在线| 97精品国产aⅴ7777| 国产视频二区在线观看| 午夜免费片| 91麻豆精品国产91久久久久| 国产伦精品一区二区三| xxxxx色| 国产天堂一区二区三区| 美国三级日本三级久久99| 精品国产1区2区3区| 亚洲二区在线播放视频| 狠狠色噜噜狠狠狠狠米奇7777| 久久精品国产一区二区三区不卡| 久久国产麻豆| 国产69精品久久久久久久久久| 亚洲精品中文字幕乱码三区91| 农村妇女毛片精品久久| 午夜激情看片| 国产精品一区二区中文字幕| 激情久久一区二区三区| 亚洲欧洲另类精品久久综合| 国产一区在线免费观看| 日本午夜久久| 日韩精品乱码久久久久久| 国内精品久久久久久久星辰影视 | 欧美精品亚洲一区| 亚洲精品久久久久中文第一暮| 午夜电影一区| 狠狠躁狠狠躁视频专区| 国产精品女人精品久久久天天| 欧美日韩国产精品一区二区三区 | 国产欧美久久一区二区三区| 国产一区二区91| 99视频国产精品| 欧美精品二区三区| 国产欧美一区二区精品久久| 国产高清精品一区二区| 福利片91| 中文字幕国内精品| 女人被爽到高潮呻吟免费看 | 欧美一区二区三区四区五区六区| 欧美一区二区三区爽大粗免费 | 国产精品爽到爆呻吟高潮不挺| 国产91丝袜在线| 久久99亚洲精品久久99果| 91精品色| 欧美视屏一区二区| 国产乱子一区二区| 欧美日韩精品在线一区|