日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于雙向長短時記憶網絡模型的中文分詞方法有效

專利信息
申請號: 201810933201.5 申請日: 2018-08-16
公開(公告)號: CN109213997B 公開(公告)日: 2021-11-19
發明(設計)人: 邵黨國;鄭娜 申請(專利權)人: 昆明理工大學
主分類號: G06F40/289 分類號: G06F40/289;G06N3/04;G06N3/08
代理公司: 暫無信息 代理人: 暫無信息
地址: 650093 云*** 國省代碼: 云南;53
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 雙向 短時記憶 網絡 模型 中文 分詞 方法
【說明書】:

發明公開了一種基于雙向長短時記憶網絡模型的中文分詞方法,首先獲得任一領域的數據集,并將數據集分為訓練集和測試集,然后將訓練集進行預處理,將預處理后的訓練集和微軟亞洲研究院的公開數據集msr分別進行字嵌入處理,再把處理好的訓練集和數據集msr分別輸入Bi?LSTM神經網絡模型中進行訓練,得到訓練集的模型X_Bi?LSTM模型和msr_Bi?LSTM模型,然后分別用X_Bi?LSTM模型、msr_Bi?LSTM模型對測試集進行標簽預測,并對兩種模型的預測概率進行權重組合,得到組合后的各漢字標簽的概率,然后利用Viterbe算法對組合后的各標簽概率進行計算得到各漢字屬于各標簽的最終概率,并將概率最大值所屬標簽作為各漢字的標簽,從而完成中文分詞,本發明可獲得較好的分詞結果,提高了分詞的準確率。

技術領域

本發明涉及一種基于雙向長短時記憶網絡模型的中文分詞方法,屬于自然語言處理領域。

背景技術

在中文中,詞與詞之間不存在分隔符,詞本身也缺乏明顯的形態標記,因此,中文信息處理的特有問題就是如何將漢語的字串分割為合理的詞語序列,即中文分詞,因而分詞是中文自然語言處理的第一步,這是不同于其他語言的自然語言處理系統的重要特點,也是影響自然語言處理在中文信息處理中應用的重要因素。近年來,國內外眾多學者在中文分詞領域做了大量研究工作,取得了一定的研究成果。但是,從實用化、效率、功能角度看,其還不能滿足實際需求。

公知的中文分詞主要包括四種方法:1.基于詞典的分詞方法,如吳春穎(基于二元語法的N-最大概率中文粗分模型,2007,27(12):2902-2905);2.基于統計的分詞方法,如Tseng H(A conditional random field word segmenter for sighan bakeoff 2005,2005:168-171);3.基于理解的分詞方法,如Wu A(Word segmentation in sentenceanalysis,1998);4.基于神經網絡的分詞方法,如Zheng X(Deep learning for Chineseword segmentation and POS tagging,2013)。其中基于詞典的分詞方法程序簡單易行,分詞速度快,但是其分詞精度受詞典的影響很大,而且不能處理歧義詞。基于統計的分詞方法只有訓練語料規模足夠大并且覆蓋面足夠廣的情況下才可以獲得較高的分詞準確率,其新詞識別能力相對較弱。基于理解的分詞方法的思想是模擬人對句子的理解,在分詞的同時進行句法、語義分析,這種方法需要大量的語言知識做支撐。基于神經網絡的分詞方法借助神經網絡自動學習數據特征,避免了傳統的分詞方法由于人為設置的局限性,但是神經網絡模型受上下文窗口大小的影響比較大,當窗口較大時容易引入過多特征帶來的雜質信息并容易出現過擬合問題,而且傳統的循環神經網絡(如RNN)只是依靠句子順序上的上文信息,并不能利用句子中的未來文本信息。

發明內容

本發明的目的在于提供一種基于雙向長短時記憶網絡模型的中文分詞方法,本發明通過對某一領域內的信息訓練來學習領域內的信息特征,對領域外的信息(msr)訓練來學習領域外的特征,從而分別獲得分詞模型,通過以上分詞模型對某一領域內信息進行分詞時可獲得較好的分詞結果,提高了分詞的準確率。

本發明的技術方案是:首先獲得任一領域的數據集,并將數據集分為訓練集和測試集,然后將訓練集進行預處理,將預處理后的訓練集和微軟亞洲研究院的公開數據集msr分別進行字嵌入處理,再把處理好的訓練集和數據集msr分別輸入到雙向長短時記憶神經網絡模型即Bi-LSTM神經網絡模型中進行訓練,分別得到訓練集的模型和msr_Bi-LSTM模型,訓練集的模型記為X_Bi-LSTM模型,然后分別用X_Bi-LSTM模型、msr_Bi-LSTM模型對測試集進行標簽預測,并對兩種模型的預測概率進行權重組合,得到組合后的各漢字標簽的概率,然后利用Viterbe算法對組合后的各漢字的各標簽概率進行計算得到各漢字屬于各標簽的最終概率,對比各漢字在各標簽下的概率值,將概率最大值所屬標簽作為各漢字的標簽,從而完成中文分詞。

本發明方法的具體步驟如下:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201810933201.5/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久久99精品国产一区二区三区| 国产精品一区二区三| 狠狠色噜噜狠狠狠狠2021免费| 91精品久久久久久久久久| 国产精品理人伦一区二区三区| 久久国产精品99国产精| 国产一级片子| 国产免费一区二区三区四区| 国产麻豆一区二区三区精品| 99国产精品丝袜久久久久久| 亚洲精品乱码久久久久久高潮| 日本精品在线一区| 欧美hdfree性xxxx| 午夜影院5分钟| 欧美一区二区三区国产精品| 久久第一区| 日韩精品久久久久久久电影99爱| 日本一区二区三区在线视频| 精品国产乱码久久久久久虫虫| 99久久精品免费看国产免费粉嫩| 亚洲国产精品综合| 中文av一区| 午夜无人区免费网站| 久久精视频| 精品国产一区二区三区四区vr| 亚洲国产精品国自产拍久久| 中文字幕精品一区二区三区在线| 狠狠色噜噜狠狠狠狠黑人| 91日韩一区二区三区| 国产日韩欧美精品一区 | 国产99久久久精品视频| 国产区精品| 久久精品综合| 色噜噜狠狠一区二区| 国产精品一区亚洲二区日本三区| 久久久精品二区| 欧美精品亚洲一区| 国产日产高清欧美一区二区三区| 国产精品国产三级国产aⅴ下载| 91热国产| 国产白丝一区二区三区| 久久五月精品| 年轻bbwbbw高潮| 国产精品欧美一区乱破| 91看片片| 国产精品高潮呻吟视频| 91精品啪在线观看国产线免费| 国产精品美女久久久另类人妖| 国产真实一区二区三区| 狠狠色噜狠狠狠狠| 夜夜夜夜夜猛噜噜噜噜噜gg| 福利片午夜| 国产精品久久久久久一区二区三区| 99久久精品免费视频| 亚洲va欧美va国产综合先锋| 亚洲精品www久久久久久广东| 99视频国产精品| 国产亚洲精品久久网站| 99视频国产在线| 国产黄一区二区毛片免下载| 黄色av中文字幕| 欧美乱大交xxxxx古装| 日韩精品中文字| 伊人欧美一区| 在线国产精品一区| 538国产精品| 视频一区二区三区欧美| 欧美日韩一区二区在线播放| 欧美日韩九区| 欧美一级久久精品| 久久精品男人的天堂| 午夜毛片电影| 国产一区二区日韩| 午夜色影院| 午夜av资源| 日本一二三区电影| 中文字幕一级二级三级| 国产一区二区在线观看免费| 精品久久久久99| 91九色精品| 午夜wwww| 国产精品一区二区在线观看免费| 国产精品女人精品久久久天天| 李采潭伦理bd播放| 亚洲少妇一区二区三区| 久久人人97超碰婷婷开心情五月| 午夜三级大片| 中文字幕一区二区三区四| 亚洲国产精品入口| 日韩久久精品一区二区三区| 国产高清在线一区| 久久99精品久久久野外直播内容| 国产日韩欧美中文字幕| 福利片91| 国产一区=区| 少妇厨房与子伦免费观看| 欧美日韩国产精品一区二区| 午夜伦情电午夜伦情电影| 国产精品一区二区免费| 日韩精品一区二区三区在线| 午夜电影一区二区三区| 久久久久亚洲| 亚洲欧美另类久久久精品2019| 亚洲精华国产欧美| 色噜噜日韩精品欧美一区二区| 国产激情二区| 四虎国产精品久久| 美女被羞羞网站视频软件| 国产精品乱码久久久久久久久| 97精品久久久午夜一区二区三区| 国产精品一区二区av麻豆| 久久99精品久久久久婷婷暖91| 午夜大片网| 亚洲精品无吗| 国产呻吟久久久久久久92 | 欧美777精品久久久久网| 国产精品刺激对白麻豆99| 久久精品爱爱视频| 狠狠色狠狠色很很综合很久久| 欧美日韩高清一区二区| 农村妇女毛片精品久久| 狠狠色综合久久婷婷色天使 | 久久影视一区二区| 国产一区正在播放| 国产精品视频久久久久久久 | xxxx18日本护士高清hd| 国产一区二区麻豆| 久久乐国产精品| 久久精品国产一区二区三区| 国产一级自拍| 91国产在线看| 久久99久久99精品免观看软件| 91精品一区二区在线观看| 欧洲在线一区| 午夜激情综合网| 蜜臀久久精品久久久用户群体| 国产精品一区二区毛茸茸| 久久夜色精品久久噜噜亚| 国产精品一区一区三区| 国产日韩欧美综合在线| 欧美一级不卡| 久久精品入口九色| 国产日韩欧美第一页| 国产全肉乱妇杂乱视频在线观看| 国产乱xxxxx国语对白| 日韩精品久久一区二区三区| 大bbw大bbw巨大bbb| 538国产精品一区二区在线| 狠狠色噜噜狠狠狠888奇米| 久久国产精久久精产国| 亚洲精品久久久久一区二区| 99爱精品视频| 68精品国产免费久久久久久婷婷| 4399午夜理伦免费播放大全| 久久亚洲精品国产日韩高潮| 国产一区二区在线观看免费| 欧美二区在线视频| 亚洲乱码av一区二区三区中文在线:| 69精品久久| 日本一区二区三区免费视频| 国产欧美一区二区三区在线播放| 91麻豆精品国产91久久久资源速度 | 久久国产精品麻豆| 久久婷婷国产综合一区二区| 色噜噜狠狠狠狠色综合久 | 国内视频一区二区三区| 亚洲一级中文字幕| 激情久久综合网| av不卡一区二区三区| 国产乱xxxxx国语对白| 丰满岳乱妇bd在线观看k8| 91国偷自产中文字幕婷婷| 色婷婷综合久久久久中文| 国产日韩欧美精品一区| 久久国产精品-国产精品| 国产v亚洲v日韩v欧美v片| 国产精品v欧美精品v日韩精品v | 国产不卡一区在线| 国产欧美视频一区二区| 久久综合狠狠狠色97| 久久精品视频3| 国产精品日本一区二区不卡视频| 欧美国产一区二区三区激情无套| 中文无码热在线视频| 久久91精品国产91久久久| 日韩精品久久一区二区三区| 欧美一区二区三区久久久精品| 亚洲国产精品美女| 亚洲四区在线| 精品国产一区二区三区免费| 欧美精品免费一区二区| 日韩av在线导航| 三级视频一区| 国产伦精品一区二区三区四区| 国模吧一区二区| 国产一卡二卡在线播放| 中文字幕亚洲欧美日韩在线不卡| 国产激情视频一区二区| 狠狠色噜噜狠狠狠合久| 少妇中文字幕乱码亚洲影视| 欧美一区二区三区在线免费观看| 精品久久久影院| 国产大片黄在线观看私人影院| 91丝袜国产在线播放| 国产一区不卡视频| 国产91热爆ts人妖系列| 午夜一区二区视频| 性国产videofree极品| 午夜看片在线| 欧美日韩综合一区 | 亚洲福利视频二区| 欧美老肥婆性猛交视频| 日韩精品中文字幕一区| 亚洲精品少妇一区二区| 日本少妇高潮xxxxⅹ| 午夜激情影院| 精品国产免费一区二区三区| 精品国产乱码一区二区三区a| 国产亚洲精品久久久久久久久动漫 | 国产资源一区二区| 精品国产乱码久久久久久久久| 国产伦精品一区二区三区四区| 久久久综合亚洲91久久98| 夜夜夜夜曰天天天天拍国产| 欧美日韩国产色综合一二三四| 欧美精品在线观看视频| 日韩一区免费在线观看| 国产精品高潮在线| 免费看性生活片| 99久久精品一区字幕狠狠婷婷 | 久久噜噜少妇网站| 欧美精品在线视频观看| 久久99精品一区二区三区| 亚洲在线久久| 久久国产激情视频| 亚洲乱强伦| 99国产精品免费| 日韩久久精品一区二区三区| 精品国产一区二区三区忘忧草| 欧美系列一区二区| 久久福利免费视频| 日韩av片无码一区二区不卡电影| 国产欧美一区二区三区视频| 国产精品一区一区三区| 黄毛片在线观看| 欧洲国产一区|