日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于Bi-LSTM-CNN的分詞方法在審

專利信息
申請號: 201710946824.1 申請日: 2017-10-12
公開(公告)號: CN107967252A 公開(公告)日: 2018-04-27
發明(設計)人: 唐華陽;岳永鵬;劉林峰 申請(專利權)人: 北京知道未來信息技術有限公司
主分類號: G06F17/27 分類號: G06F17/27;G06N3/08
代理公司: 北京君尚知識產權代理事務所(普通合伙)11200 代理人: 司立彬
地址: 100102 北京市朝陽區阜*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 bi lstm cnn 分詞 方法
【說明書】:

技術領域

發明屬于計算機軟件技術領域,涉及一種基于Bi-LSTM-CNN的分詞方法。

背景技術

自然語言處理問題中亞洲類型的文字并非像西文具有天然的空格分隔符,很多西文處理方法并不能直接用于亞洲類型(中文、韓文和日文)文字的處理,這是因為亞洲類型(中文、韓文和日文)必須經過分詞的這道工序才能保持和西文一致。因此,分詞在亞洲類型文字的處理中是信息處理的基礎,其應用場景包括:

1.搜索引擎:搜索引擎中一個重要的功能就是做文檔的全文索引,其內容是將文字進行分詞,然后將文檔的分詞結果和文檔形成一個倒排索引,用戶在查詢的時候也是先將查詢的輸入語句進行分詞,而后將分詞的結果和索引數據庫進行對比,從而找出與當前輸入最為相似的文檔。

2.自動摘要生成:自動摘要是指將一篇較長的文檔用一段較短的語言文字去總結。而在總結的過程中,就需要計算一篇文檔中關鍵詞,因此在計算關鍵詞之前必須先對文檔做分詞處理。

3.自動校對:自動校對是指對一段文字作語法錯誤的檢查,其檢查的粒度還是基于詞的方式做的檢查,因此需要將用戶輸入的連續文字做分詞處理。

傳統的分詞方法可以分為基于詞典的分詞,基于詞頻統計的方法以及基于知識的方法;基于詞典的分詞嚴重依賴于詞典庫,詞頻統計的HMM(隱馬爾可夫)和CRF(條件隨機場)其只能關聯當前詞的前一個詞的語義。基于知識的人工神經網絡模型因模型訓練時的梯度消失問題,在實際的應用中網絡層數少,最終分詞結果優勢不明顯。

基于詞典的分詞方法嚴重依賴于詞典庫,效率比較低,且不能夠識別未登錄詞;本發明中登錄詞指的是已經出現在語料詞表中的詞,未登錄詞指的是沒有出現在語料詞表中的詞。

基于詞頻統計分詞方法(例如N-Gram),其只能關聯當前詞的前N-1個詞的語義,識別精度不夠高,當N增加的時,效率非常低。而且對未登錄的識別率偏低。

發明內容

針對現有技術中存在的技術問題,本發明的目的在于提供一種基于Bi-LSTM-CNN的分詞方法。本發明通過自然語言處理中的序列標注(sequential labeling)將一個序列作為輸入,并訓練一個模型使其為每一序列片段數據產生正確的輸出。

針對與中文類似(英文天然帶有空格作為詞之間的分割符)的語言進行分詞的方法。本發明要解決的核心問題包含三個:1分詞的效率,2分詞的精度,3未登錄詞的識別精度。

本發明的技術方案為:

一種基于Bi-LSTM-CNN的分詞方法,其步驟包括:

1)將訓練語料數據OrgData轉化為字符級的語料數據NewData;

2)統計該語料數據NewData字符得到一字符集合CharSet,并對該字符集合CharSet中每個字符進行編號,得到該字符集合CharSet對應的字符編號集合CharID;統計NewData中的字符的標簽,得到一標簽集合LabelSet,對該標簽集合LabelSet的標簽進行編號,得到對應的標簽編號集合LabelID;

3)將NewData按照句子長度劃分,得到若干句子;然后根據句子長度對得到的句子進行分組,得到包括n組句子的數據集合GroupData;

4)隨機無放回的從該數據集合GroupData中選取一句子分組,從該句子分組中抽取BatchSize個句子,每一個句子的字符構成一數據w,該句子的字符對應的標簽集合為y;根據字符編號集合CharID將數據w轉換為對應的編號,得到數據BatchData;根據標簽編號集合LabelID將集合y中的標簽轉換為對應的編號,得到數據yID

5)將步驟4)生成的多個數據BatchData及其對應的標簽數據yID一起送入深度學習模型Bi-LSTM-CNN,訓練該深度學習模型Bi-LSTM-CNN的參數,當深度學習模型產生的損失值Cost(y′,yID)滿足設定條件或者達到最大迭代次數N,則終止深度學習模型的訓練,得到訓練后的深度學習模型Bi-LSTM-CNN;否則采用步驟4)的方法重新生成數據BatchData訓練該深度學習模型Bi-LSTM-CNN;

6)將待預測的數據PreData轉換成與該深度學習模型Bi-LSTM-CNN匹配的數據PreMData,并將其送入訓練好的深度學習模型Bi-LSTM-CNN,得到分詞結果OrgResult。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京知道未來信息技術有限公司,未經北京知道未來信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710946824.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产一卡在线| 国偷自产一区二区三区在线观看 | 日本亚洲国产精品| 亚洲码在线| 国产69精品福利视频| 99久久夜色精品国产网站| 欧美国产精品久久| 亚洲高清乱码午夜电影网| 夜夜爽av福利精品导航| 久久精品亚洲一区二区三区画质| 日本精品视频一区二区三区| 日本美女视频一区二区三区| 中文字幕在线视频一区二区| 国产精品欧美日韩在线| 久久久999精品视频| 91麻豆精品国产91久久久无限制版| 国产一区激情| 欧美精品在线视频观看| 欧美日韩亚洲三区| 日韩亚洲精品在线| 国产性猛交xx乱| 精品日韩久久久| 99精品国产一区二区三区麻豆| 中文字幕一区二区三区不卡| 精品久久香蕉国产线看观看gif| 国产日韩欧美网站| 精品videossexfreeohdbbw| 999亚洲国产精| 国产区二区| 91波多野结衣| 岛国黄色av| 精品国产伦一区二区三区免费| 久久一区二| 99热久久精品免费精品| 免费毛片**| 国产二区不卡| 国产精品久久久久久久久久久久冷| 亚洲色欲色欲www| 国产二区三区视频| 精品少妇一区二区三区免费观看焕 | 天堂av色婷婷一区二区三区| 国产一区二区免费在线| 日韩av在线播| 国内久久精品视频| 亚洲精品456| 国产乱一乱二乱三| 91超薄丝袜肉丝一区二区| 国产精品久久久久久久久久软件| 一区二区三区免费高清视频| 国产精品高潮呻| 热久久国产| 国产欧美精品va在线观看| 91波多野结衣| 蜜臀久久99精品久久久久久网站| 国产性猛交| 亚洲精品国产精品国自产网站按摩| 国产二区精品视频| 欧美午夜精品一区二区三区| 欧美三区二区一区| 久久综合伊人77777麻豆最新章节| 国产乱人激情h在线观看| www色视频岛国| 精品久久久久久中文字幕大豆网| 国产97久久| 国产精品视频免费一区二区| 日本一区二区电影在线观看| 公乱妇hd在线播放bd| 欧美日韩中文字幕一区二区三区 | 日韩欧美一区二区久久婷婷| 日韩精品久久久久久久的张开腿让 | 中文字幕一区二区三区四| 国产在线拍偷自揄拍视频 | 激情久久综合网| 久久国产精品-国产精品| 欧美一区二区三区艳史| 日本一区欧美| 欧美一区二区三区日本| 亚洲精品一区,精品二区| 欧美乱码精品一区二区三| 免费观看又色又爽又刺激的视频 | 亚洲精品91久久久久久| 欧美精品日韩| 午夜影院一级片| 国产精品中文字幕一区二区三区| 亚洲乱视频| 国产乱一区二区三区视频| 国产精品国产三级国产aⅴ下载| 国产精品高潮在线| 大bbw大bbw巨大bbb| 欧美一级久久久| 国产精品人人爽人人做av片| 中文字幕a一二三在线| 国产精品无码专区在线观看 | 一区二区在线不卡| 国产精品人人爽人人做av片| 久久99精品国产麻豆婷婷洗澡| 国产日韩麻豆| 国产欧美一区二区精品性色超碰| 久久99精品国产麻豆婷婷洗澡| 性国产日韩欧美一区二区在线| 猛男大粗猛爽h男人味| 99久久婷婷国产综合精品电影| 国产一区二区电影| 欧美视频1区| 2023国产精品自产拍在线观看| 粉嫩久久久久久久极品| 日韩欧美精品一区二区| 欧美综合在线一区| 国产精品综合在线观看| 中文字幕一区二区三区乱码| 狠狠色噜噜狠狠狠四色米奇| 日本护士hd高潮护士| 欧美一区亚洲一区| 精品国产亚洲一区二区三区| 日日噜噜夜夜狠狠| 欧美日韩综合一区二区| 精品国产乱码久久久久久软件影片| 又色又爽又大免费区欧美| 欧美一级片一区| 丝袜诱惑一区二区三区| 亚洲精品国产久| 国产在线视频99| 国产69精品久久久久按摩| 李采潭伦理bd播放| 在线国产精品一区二区| 爽妇色啪网| 国产一区二区在线精品| 欧美日韩国产一二| 日韩精品久久久久久久的张开腿让| 国产一区日韩一区| 国产视频一区二区三区四区| 欧美日韩国产综合另类| 日韩亚洲欧美一区二区 | 国产女人和拘做受在线视频| 99久久婷婷国产综合精品草原| 日韩久久精品一区二区| 久久九精品| 亚洲国产精品肉丝袜久久| 国产欧美一区二区三区免费看| 国产精品不卡在线| 欧美精品九九| 亚洲欧美制服丝腿| 性少妇freesexvideos高清bbw| 久99久精品| www.久久精品视频| 日本一区二区三区免费播放| 国产精品视频久久久久久久| 九九视频69精品视频秋欲浓| 26uuu色噜噜精品一区二区 | 亚洲**毛茸茸| 韩日av一区二区三区| 大bbw大bbw巨大bbw看看| 亚洲乱子伦| 96精品国产| av午夜在线| 日本一二三不卡| 久久久久亚洲最大xxxx| 秋霞三级伦理| 日本护士hd高潮护士| 欧美freesex极品少妇| 午夜理伦影院| 国产欧美一区二区在线| 狠狠色噜噜狠狠狠狠色吗综合| 韩国女主播一区二区| 国产区二区| 国产精品5区| 中文丰满岳乱妇在线观看| 国产91精品一区二区麻豆亚洲| 夜夜躁日日躁狠狠躁| 午夜色大片| 性精品18videosex欧美| 精品国产一区二区在线| www.久久精品视频| 视频一区二区三区中文字幕| 激情久久久久久| 四虎国产精品永久在线| 中文字幕一区二区三区免费| 国产精品日韩电影| 男女午夜影院| 日韩三区三区一区区欧69国产| 国产一区二区在线观看免费| 国产视频一区二区视频| 亚洲国产欧美国产综合一区| 日日夜夜一区二区| 国产精品免费一视频区二区三区| 中文乱码字幕永久永久电影| 午夜特片网| 免费毛片**| av素人在线| 欧美一区二区三区激情视频| 香蕉av一区二区| 国产免费一区二区三区网站免费| 91精品福利观看| 日韩午夜电影院| 午夜av网址| 国产精品视频免费一区二区| 久久影视一区二区| 国产原创一区二区 | 国产日韩欧美精品一区 | 亚洲麻豆一区| 亚洲精品久久久久999中文字幕 | 一区二区三区四区中文字幕| 国产91视频一区| 99精品国产一区二区三区麻豆 | 亚洲精品性| 右手影院av| 国产精品麻豆一区二区| 中文字幕一区二区三区免费| 久久一二区| 欧美激情视频一区二区三区| 丝袜美腿诱惑一区二区| 日韩精品乱码久久久久久| 国产伦精品一区二区三区照片91 | 日韩av在线资源| 日韩精品在线一区二区三区| 四虎国产永久在线精品| 日韩精品一区二区三区不卡| 亚洲精品日本无v一区| 日韩中文字幕一区二区在线视频 | 国产91精品一区| 中文字幕欧美日韩一区 | 精品国产91久久久| 欧美日韩偷拍一区| 欧美一区二区三区不卡视频| 日韩欧美激情| 国产69精品久久久久孕妇不能看| 中文字幕日韩有码| 国内少妇偷人精品视频免费| 国产色午夜婷婷一区二区三区 | 久久两性视频| 91精品一区二区在线观看| 91精品福利在线| 国产农村乱色xxxx| 狠狠综合久久av一区二区老牛| 激情久久久久久| 天天射欧美| 亚洲精品乱码久久久久久国产主播| 日韩精品中文字幕久久臀| 欧美亚洲另类小说| 91超碰caoporm国产香蕉| 二区三区视频| 2020国产精品自拍| 日韩一区高清| 福利视频亚洲一区| 久久久人成影片免费观看| 日本一级中文字幕久久久久久|