日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種將深度學習應用于中文分詞的方法在審

專利信息
申請號: 202010000500.0 申請日: 2020-01-02
公開(公告)號: CN111209749A 公開(公告)日: 2020-05-29
發明(設計)人: 曾誠;張敏;溫超東;任俊偉;譚道強;盛瀟 申請(專利權)人: 湖北大學
主分類號: G06F40/289 分類號: G06F40/289;G06F40/242;G06F40/126;G06N3/04
代理公司: 武漢帥丞知識產權代理有限公司 42220 代理人: 朱必武
地址: 430000 湖北*** 國省代碼: 湖北;42
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 深度 學習 應用于 中文 分詞 方法
【權利要求書】:

1.一種將深度學習應用于中文分詞的方法,其特征在于,包括如下步驟:

S1:數據預處理,借助文中原有的標點符號,段落分隔符等具有分割作用的符號對文檔進行切分,提取句子的字特征,得到第一數據;

S2:構建用于模型輸入的字典,字典包括源字典src_dict和目標字典tgt_dict兩部分,將第一數據進一步處理構建用于模型輸入的字典,得到第二數據;

S3:使用模型進行訓練,將src_dict和tgt_dict輸入到訓練模型中,使用BPEmd模型對預處理的數據進行字嵌入預訓練,第一數據作為Universal-Transformer的輸入,得到維度增加后的特征向量,第二數據作為CRF層的輸入,得到目標字向量模型。

2.根據權利要求1所述的一種將深度學習應用于中文分詞的方法,其特征在于,所述S1中字特征包括四種詞位置,分別為:詞的首字B、詞的中間字M、詞的尾字E、單字成詞S,通過詞位置對目標語料數據進行標注得到第一數據,將語料數據轉化成為json格式,為了加速訓練將第一數據轉為hdf5格式。

3.根據權利要求2所述的一種將深度學習應用于中文分詞的方法,其特征在于,所述S2中用空格把語料數據集合切分成句子序列,再用制表符“\t”把句子序列切分成單個字符和帶有字符對應的詞位置標注兩個序列,遍歷兩個序列,統計每個字符出現的頻次,如果頻次小于閾值5則選擇忽略,最終得到源字典src_dict和目標字典tgt_dict。

4.根據權利要求3所述的一種將深度學習應用于中文分詞的方法,其特征在于,所述S3中使用模型進行訓練,得到訓練的模型步包括:

S31:使用BPEmd模型對預處理的數據進行字嵌入預訓練,使字向量的字特征維度增加,得到維度增加后的特征向量;

S32:所述S1中的第一數據作為Universal-Transformer的輸入,模型編碼某個字符,與序列中其他字符進行運算,得到該字符與序列中左右字符的句法和語義關系編碼,得到提取了字符上下文關系特征的向量;

S33:所述S2中的第二數據作為CRF層的輸入,對語料數據的每個字向量的各種詞位置分類的概率根據上下文信息進行修訂,得到目標字向量模型。

5.根據權利要求4所述的一種將深度學習應用于中文分詞的方法,其特征在于,準備足夠大的訓練語料數據集合,確定期望的確定期望的詞表大小,將單詞拆分為字符序列并在末尾添加后綴“/w”,統計單詞頻率,統計每一個連續字節對的出現頻率,選擇最高頻者合并成新的,重復前述步驟直到達到設定的詞表大小或下一個最高頻的字節對出現頻率為1,其中停止符/w的意義在于表示詞后綴,隨著合并次數的增加。

6.根據權利要求5所述的一種將深度學習應用于中文分詞的方法,其特征在于,所述S32中,Universal-Transformer模型輸入一個字符序列,由編碼器和解碼器提取字符之間的語義語法特征后,根據任務類型輸出另一個字符序列,從編碼器輸入的句子首先會經過一個自注意力層,這層幫助編碼器在對每個字符編碼時關注輸入序列的其他字符,自注意力層的輸出會傳遞到前饋神經網絡中,前饋網絡是一個Transition層,通過共享權重的方法循環計算,這里的循環是指深度循環,每個位置的單詞對應的前饋神經網絡都完全一樣,編碼器的輸出作為解碼器的輸入,解碼器中也有編碼器的自注意力層和前饋層,這兩個層之間還有一個注意力層,用來關注輸入序列的相關部分,比如一個序列序列(a,b,c,d),先經過embedding表示成(,),在經過一層attention+transition表示成(,),如果是循環神經網絡,要先計算,再計算和,而transformer的自注意力層可以同時計算(,),再計算t+1的,這樣,每個self-attention+transition的輸出可以表示為:

這里Transition function可以和之前一樣是全連接層,也可以是卷積層;Universal-Transformer的位置嵌入考慮字符的位置和時間維度,每一次循環都會重新做一次坐標嵌入。

7.根據權利要求6所述的一種將深度學習應用于中文分詞的方法,其特征在于,所述S33中,把輸出數據輸入到CRF模型中,對中文句子的每個字向量的各種詞位置分類的概率根據上下文信息進行修訂,得到目標模型,CRF使得標記序列的每個元素依賴于觀察序列中相互聯系的特征,而且模型可以基于特征的重要性來賦予各特征不同的權重,模型中可以加入一些約束來保證最終預測結果是有效的,這些約束可以在訓練數據時被CRF自動學習得到,給定觀察序列X,如果目標序列Y的條件概率分布p(Y|X)滿足馬爾科夫性:

那么p(Y|X)為線性鏈條條件隨機場,在標注問題中,對于輸入的可觀測序列,某個特定的狀態序列的概率定義為:

其中, 為轉移函數,表示觀察序列在其標注序列在和之間的轉移概率,為狀態函數,表示對于觀察序列X第i位置的標記為y:的概率,、分別對應著相應函數的權重,需要從訓練樣本中估計出來。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北大學,未經湖北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202010000500.0/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产乱码精品一区二区三区介绍 | 日韩精品中文字幕在线| xoxoxo亚洲国产精品| 亚洲国产精品激情综合图片| 久久一二区| 91精品一区二区中文字幕| 日本伦精品一区二区三区免费| 亚洲一区欧美| 国产精品久久久久久久久久久久久久不卡| 国产天堂一区二区三区| 国产精品女同一区二区免费站| 国产精品三级久久久久久电影| 国产精品一区二区日韩新区| 91久久国产露脸精品| 国产精品欧美久久| 国产97在线播放| 精品久久小视频| 狠狠躁日日躁狂躁夜夜躁av| 国产欧美日韩精品一区二区图片| 国产精品自产拍在线观看桃花| 亚洲一二三在线| 久久亚洲精品国产一区最新章节| 91精品国产九九九久久久亚洲| 久久精品男人的天堂| 一本一道久久a久久精品综合蜜臀| 曰韩av在线| 蜜臀久久99精品久久一区二区| 国产视频一区二区视频| 国产精品96久久久久久久| 国产色一区二区| 国产电影精品一区二区三区| 夜夜嗨av禁果av粉嫩av懂色av| 97久久国产亚洲精品超碰热 | 精品国产九九九| 在线观看欧美日韩国产| 国产色婷婷精品综合在线手机播放| 满春阁精品av在线导航| 丰满少妇在线播放bd日韩电影| 日本精品一二三区| 国产高清无套内谢免费| 一区二区三区国产精品视频| 在线精品视频一区| 精品无人国产偷自产在线| 国产99久久久久久免费看| 国产精品久久久久四虎| 99爱精品在线| 88国产精品视频一区二区三区| 一区二区免费播放| 国产91精品一区二区麻豆亚洲| 91一区二区在线观看| 自拍偷在线精品自拍偷写真图片| 久99久精品| 久久精品com| 国产日韩欧美不卡| 日韩精品午夜视频| 亚洲精品国产suv| 亚洲少妇中文字幕| 精品久久国产视频| 色综合欧美亚洲国产| 91一区二区三区在线| 久久福利免费视频| 国产午夜亚洲精品| 国产一级一区二区三区| 99精品久久久久久久婷婷| 午夜国产一区| 老太脱裤子让老头玩xxxxx| 亚洲精品国产一区二| 丝袜诱惑一区二区三区| 一区二区三区欧美精品| 91看片app| 国产91热爆ts人妖系列| 亚洲精品日韩色噜噜久久五月| 国产一二区精品| 久久天天躁狠狠躁亚洲综合公司 | 国产欧美精品一区二区三区-老狼| 国产原创一区二区 | 日韩av在线一区| 综合久久国产九一剧情麻豆| 亚洲欧美另类综合| 国产欧美一区二区三区免费看| 96国产精品视频| 欧美一级日韩一级| 一区二区三区在线影院| 97久久精品人人澡人人爽| 26uuu亚洲国产精品| 日韩亚洲精品在线| 国产亚洲精品久久久久久网站| 粉嫩久久久久久久极品| 国产乱了高清露脸对白| 91精品一区| 午夜剧场一区| 国产精品二区一区| 午夜av免费观看| 国产一级二级在线| 欧美日韩国产123| 欧美一区免费| 国产高清在线精品一区二区三区| 国产理论一区二区三区| 99精品小视频| 国产精品5区| 亚洲国产精品精品| 97人人模人人爽人人喊0| 国产在线一二区| 激情久久一区二区三区| 国产偷亚洲偷欧美偷精品| 欧美乱战大交xxxxx| 国产精品国外精品| 国产人澡人澡澡澡人碰视| 久久精品亚洲一区二区三区画质| 狠狠插影院| 欧美精品在线视频观看| 狠狠色噜噜狠狠狠狠88| 国产欧美精品va在线观看| 亚洲精品久久久久一区二区| 国产91视频一区二区| 国产黄色一区二区三区| 二区三区视频| 国产精品一区二区av日韩在线| 538国产精品| 国产精品久久91| 国产高清在线精品一区二区三区| 国产理论片午午午伦夜理片2021 | 国产精品对白刺激久久久| 午夜激情在线播放| 久久精品—区二区三区 | 精品福利一区二区| 国产精品视频免费一区二区| 久久免费精品国产| 精品久久久久久亚洲综合网| 免费看性生活片| 欧美午夜精品一区二区三区| 99精品一区| 午夜影院5分钟| 国产视频一区二区不卡| 日韩av在线网址| 国产精欧美一区二区三区久久| 91精品一区二区在线观看 | 91久久香蕉国产日韩欧美9色| 波多野结衣女教师30分钟| 久久99国产视频| 亚洲欧美国产一区二区三区| 国产一区影院| av午夜在线观看| 欧美日韩国产色综合一二三四| 国产69精品久久久久app下载| 色一情一交一乱一区二区三区 | 亚洲欧洲一区二区| 日本白嫩的18sex少妇hd| 精品国产免费久久| 国产99小视频| 精品国产乱码久久久久久久久 | 日本精品视频一区二区三区| 久久久精品欧美一区二区免费| 欧美系列一区| 欧美在线一区二区视频| 亚洲国产精品一区在线| 99国产精品久久久久| 亚洲四区在线观看| 亚洲精品乱码久久久久久国产主播| 国产www亚洲а∨天堂| 久久久精品a| 亚洲乱子伦| 99久久婷婷国产综合精品草原 | 91黄在线看 | 亚洲精品一区在线| 欧美激情图片一区二区| 香蕉视频在线观看一区二区| 欧美日韩一区二区三区不卡| 欧美日韩国产午夜| 性精品18videosex欧美| 高清国产一区二区三区| 久久国产麻豆| 激情久久综合网| 精品国产一区二区三区四区vr| 国产乱人乱精一区二视频国产精品| 欧美国产一二三区| 国产精品久久免费视频| 久久99精品久久久野外直播内容| 99精品一区二区| 国产精品国产一区二区三区四区| sb少妇高潮二区久久久久| 国产电影一区二区三区下载| 久久久久国产精品视频| 538国产精品一区二区| 在线视频国产一区二区| xxxxhdvideosex| 一区二区三区欧美在线| 精品国产91久久久| 亚洲精品少妇久久久久| 国产美女三级无套内谢| 91精品福利在线| 亚洲欧美日韩国产综合精品二区| 欧美日韩精品中文字幕| 国产午夜精品一区二区三区四区| 99re久久精品国产| 久久午夜精品福利一区二区| 久久99精| 国产91高清| 色妞www精品视频| 久久亚洲精品国产日韩高潮| 色噜噜狠狠狠狠色综合久| 久久天天躁狠狠躁亚洲综合公司| 97精品久久久午夜一区二区三区| 国产精品5区| 国产一区观看| aaaaa国产欧美一区二区| 精品亚洲午夜久久久久91| 一区二区中文字幕在线| 日本一区二区三区免费视频| 亚洲欧美国产精品va在线观看| 久久99精品久久久大学生| 国产精品久久国产三级国电话系列 | 国产vsv精品一区二区62| 91丝袜诱惑| 国产精品一区二区毛茸茸| xxxxx色| 一本色道久久综合亚洲精品浪潮| 色婷婷噜噜久久国产精品12p| 国产农村妇女精品一二区| 午夜精品一二三区| 91麻豆精品国产91久久久更新时间| 欧美一区二区三区性| 国产一卡在线| 亚洲欧美制服丝腿| 国产精品一区二区免费视频| 欧美一区二区三区免费播放视频了| 国产丝袜在线精品丝袜91| 国产真裸无庶纶乱视频| 爱看av在线入口| 国产偷亚洲偷欧美偷精品 | 欧美日韩国产色综合视频| 亚洲欧美一卡二卡| 一区二区国产盗摄色噜噜| 免费的午夜毛片| 97人人模人人爽视频一区二区| 午夜欧美a级理论片915影院| freexxxxxxx| 国产午夜一级一片免费播放| 国产欧美精品一区二区三区-老狼| 国产欧美一区二区三区视频| 精品国产一区二区三区免费| 乱子伦农村| 色妞妞www精品视频| 视频一区二区三区中文字幕| 999亚洲国产精| 国产一区二区精品在线|