日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]文本實體的識別方法及相關裝置在審

專利信息
申請號: 202110361172.1 申請日: 2021-04-02
公開(公告)號: CN113065346A 公開(公告)日: 2021-07-02
發明(設計)人: 何東;陳華智;王紅凱;黃宇騰;徐海青;毛冬;張辰;饒涵宇;陳是同;梁翀;浦正國;余江斌 申請(專利權)人: 國網浙江省電力有限公司信息通信分公司;國網浙江省電力有限公司;安徽繼遠軟件有限公司;國網信息通信產業集團有限公司
主分類號: G06F40/279 分類號: G06F40/279;G06N3/04;G06N3/08
代理公司: 北京集佳知識產權代理有限公司 11227 代理人: 尹秀
地址: 310007 浙*** 國省代碼: 浙江;33
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文本 實體 識別 方法 相關 裝置
【說明書】:

本申請公開了文本實體的識別方法及相關裝置,其中,方法包括:從待處理文本序列中獲取指代同一概念的實體表述;實體表述用于實體歸一化;將實體表述轉換為預設長度的表述向量;對待處理文本序列進行詞嵌入處理,得到向量;對向量中用于實體識別的上下文特征進行編碼,得到編碼向量;對表述向量與編碼向量進行拼接,得到拼接向量;將拼接向量解碼為待處理文本序列的預測序列。本申請以向量為紐帶將實體歸一化和實體識別在向量空間上的聯結起來。拼接向量既包含了實體歸一化的信息,也包含了實體識別的信息,并且,實體歸一化信息作用于實體識別。由于實體識別利用了實體歸一化的信息,從而,使得實體識別結果更全面,提高實體識別的準確性。

技術領域

本申請涉及數據處理領域,尤其涉及文本實體的識別方法及相關裝置。

背景技術

文本實體識別是信息抽取的關鍵技術,是眾多復雜的自然語言處理應用的基石。然而,由于自然語言豐富的表達形式,導致識別到的文本實體中可能存在指代同一個實體概念的多種不同的表述形式,使得識別到的文本實體難以被直接應用。已有研究表明,實體表述的歸一化有助于文本實體的識別。

目前,采用實體表述的歸一化提升實體識別的過程,包括:先識別出待處理文本中的文本實體表述,得到候選文本實體,再基于現有的詞典和知識庫,對識別出的候選文本實體進行實體表述的歸一化。

但是,實體歸一化后得到的文本實體的準確性低,即實體歸一化后得到的文本實體是不全面的,即可能漏掉了待處理文本中的部分文本實體。

發明內容

本申請提供了文本實體的識別方法及相關裝置,目的在于解決實體歸一化后得到的文本實體的準確性低的問題。

為了實現上述目的,本申請提供了以下技術方案:

本申請提供了一種文本實體的識別方法,包括:

從待處理文本序列中獲取指代同一概念的實體表述;所述實體表述用于實體歸一化;

將所述實體表述轉換為預設長度的表述向量;

對所述待處理文本序列進行詞嵌入處理,得到向量;

對所述向量中用于實體識別的上下文特征進行編碼,得到編碼向量;

對所述表述向量與所述編碼向量進行拼接,得到拼接向量;

將所述拼接向量解碼為所述待處理文本序列的預測序列。

可選的,所述實體表述至少包括:所述待處理文本序列中非標準實體表述的定義指示的實體表述對;

所述從待處理文本序列中獲取指代同一概念的實體表述,包括:

基于句法結構和詞法結構的規則,識別所述待處理文本序列中用于定義實體的非標準表述;

從所述非標準表述中抽取指代同一個概念的實體表述對。

可選的,所述對所述向量中用于實體識別的上下文特征進行編碼,得到編碼向量,包括:

將所述向量輸入預設的雙向LSTM模型;所述雙向LSTM模型輸出所述編碼向量。

可選的,在所述將所述實體表述對轉換為預設長度的表述向量之后,還包括:

通過線性層對所述表述向量進行處理。

可選的,在所述對所述表述向量與所述編碼向量進行拼接,得到拼接向量之后,且,在所述將所述拼接向量解碼為所述待處理文本序列的預測序列之前,還包括:

通過全連接層對所述拼接向量進行轉換,得到轉換后的拼接向量。

可選的,在所述對所述待處理文本序列進行詞嵌入處理,得到向量之后,且,在所述對所述向量中用于實體識別的上下文特征進行編碼,得到編碼向量之前,還包括:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網浙江省電力有限公司信息通信分公司;國網浙江省電力有限公司;安徽繼遠軟件有限公司;國網信息通信產業集團有限公司,未經國網浙江省電力有限公司信息通信分公司;國網浙江省電力有限公司;安徽繼遠軟件有限公司;國網信息通信產業集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202110361172.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美日韩一区二区电影| 一二三区欧美| 精品国产免费一区二区三区| 一色桃子av| 国产精品九九九九九九九 | 午夜av男人的天堂| 97人人模人人爽人人喊小说| 视频一区二区三区中文字幕| 久久精品麻豆| 国产一区二区三区精品在线| 日韩精品中文字幕一区| 欧美一级不卡| 日本三级韩国三级国产三级| 国产乱码精品一区二区三区介绍 | 中文乱码字幕永久永久电影| 精品国产区| 亚洲精品久久久久不卡激情文学 | 国产欧美日韩在线观看| 鲁丝一区二区三区免费| 欧美一区二区三区日本| 91制服诱惑| 国产999在线观看| 国产精品69av| 国模少妇一区二区三区| 日韩av免费网站| 欧美在线视频三区| 7799国产精品久久99| 国产一区二区三区大片| 91精品国产综合久久婷婷香| 日韩精品少妇一区二区在线看| 国产一区二区电影在线观看| 性生交片免费看片| 国产欧美三区| 欧美日韩综合一区| 日本神影院一区二区三区| 欧美日本91精品久久久久| 久久精品一区二区三区电影| 久久99精品国产麻豆婷婷| 99久久国产免费,99久久国产免费大片| a级片一区| 理论片高清免费理伦片| 亚洲激情中文字幕| 高清欧美精品xxxxx| 国产精品1区二区| 97国产婷婷综合在线视频,| 国内视频一区二区三区| 亚洲欧美制服丝腿| 丝袜美腿诱惑一区二区| 午夜电影一区| 日韩一级片免费视频| 日韩精品一区二区三区中文字幕| 亚洲国产精品入口| 69久久夜色精品国产69–| 欧美日韩国产精品一区二区三区| 欧美极品少妇videossex| 欧美一区二区精品久久| 亚洲欧洲国产伦综合| 久久亚洲精品国产日韩高潮| 91久久国产露脸精品国产| 强制中出し~大桥未久在线播放| 亚洲国产视频一区二区三区| 国产精品v欧美精品v日韩| 国产视频二区| 狠狠色狠狠综合久久| 激情久久久| 中文字幕日韩一区二区| 亚洲高清毛片一区二区| 亚洲福利视频一区二区| 欧美日韩激情在线| 国产一区二区激情| 国产一区二区三区久久久| 国产欧美一区二区三区在线看| 91黄色免费看| 蜜臀久久99静品久久久久久 | 午夜毛片在线观看| 亚洲国产精品日本| 久久一级精品视频| 香蕉av一区二区三区| 狠狠躁夜夜| 香港三日本8a三级少妇三级99| 亚洲1区在线观看| 国产69精品久久久久999小说|