日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種分詞訓練方法及裝置在審

專利信息
申請號: 201710229249.3 申請日: 2017-04-10
公開(公告)號: CN108694164A 公開(公告)日: 2018-10-23
發明(設計)人: 張春榮 申請(專利權)人: 普天信息技術有限公司
主分類號: G06F17/27 分類號: G06F17/27
代理公司: 北京路浩知識產權代理有限公司 11002 代理人: 王慶龍
地址: 100080 北京*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 標注 分詞 目標模型 樣本 語料 樣本點 預設 接收用戶 模型基礎 模型結合 人工標注 閾值獲取 工作量 重復
【說明書】:

發明實施例公開了一種分詞訓練方法及裝置,方法包括:獲取未標注樣本,計算未標注樣本中每個樣本點的不確定值;根據每個樣本點的不確定值,將未標注樣本劃分為若干個子樣本,并根據不確定閾值獲取每個子樣本中分詞訓練的目標語料;接收用戶對目標語料的標注操作,根據標注操作生成標注結果;根據標注結果和預設模型,得到分詞訓練的目標模型。本發明實施例通過計算樣本點的不確定值,并獲取特定不確定值的目標語料,僅對目標語料進行人工標注,除了能夠避免重復標注,而且極大程度上降低了標注的工作量;同時通過將標注結果和預設模型結合,使得目標模型在預設模型基礎上進行分詞訓練,目標模型的獲取更為高效,也使得目標模型更為精簡。

技術領域

本發明實施例涉及計算機技術領域,具體涉及一種分詞訓練方法及裝置。

背景技術

中文分詞是中文信息處理中的重要基礎問題,在機器翻譯、信息檢索、語音合成等諸多領域有著廣泛應用。隨著有指導中文分詞方法的逐漸完善,表現較好的分詞系統準確率能達到95%以上。但是在跨領域中文分詞中,由于目標領域內容的變化,不可避免地帶來了諸多訓練語料中未出現的領域詞匯。如果原領域是新聞詞匯(例如常用的1998年人民日報語料),而目標領域是軌道交通招投標詞匯,經常出現新聞領域不常用的詞匯,這使得分詞系統的準確率大大降低。

針對領域適應性問題,需要通過引入新的特征來訓練中文分詞模型,加強中文分詞模型的領域適應性。傳統中文分詞方法大多基于人工詞典和需要大規模標注語料的統計模型,都是有指導的監督學習方法(即被動學習)。但是,無論編寫詞典還是標注語料庫,都需要大量人工勞動。常見基于字標注分詞方法,通過引入新的特征來訓練中文分詞模型,加強中文分詞模型的領域適應性。圖1為領域自適應訓練和分詞過程(其中虛線是訓練過程,實線是中文分詞過程)。領域適應性的分詞訓練:首先將“目標領域”未標注的語料進行人工標注,然后與“原領域”標注語料進行混合訓練,得到目標領域模型。領域適應性的中文分詞過程:利用得到的目標領域模型對目標領域文本進行分詞,以獲得中文分詞結果。這個訓練過程需要人工標注語料庫,并用大規模已標注語料來對系統模型進行訓練,而獲取大量的標注樣本是一件非常費時費力的工作。

在實現本發明實施例的過程中,發明人發現現有的方法在進行適應性訓練時,人工標注的目標領域語料越多,訓練的模型就越有效,就需要獲取盡量多的目標領域的大規模標注語料,如圖1所示。要標注大規模的數據集,每次按順序或隨機選取樣本進行標注的代價相當大,通常獲取大量的標注樣本,是一件非常費時費力的工作。因此如何從大量的未標注樣例中挑選最有價值的樣例進行標注,使用少量人工標注樣例進行訓練得到的更有效的領域訓練模型,是需要考慮的問題。另外,重復標注問題是對人工標注的大大浪費。例如,在訓練數據中“人民”一詞共出現了多次,這就意味著需要對該詞重復標注多次。其次,現有的適應性訓練中需要對原領域和目標領域標準的語料進行混合訓練。這在實際中有多方面局限性:1)大規模語料是動態變化的,每次數據量(訓練樣本)的變化都引起重復學習;2)針對目標領域,只需修改因目標領域語料變化而涉及的規則,需要快速獲得模型并部署,而在海量數據的情況下混合訓練是一種耗時的工作。

發明內容

由于現有的方法存在上述問題,本發明實施例提出一種分詞訓練方法及裝置。

第一方面,本發明實施例提出一種分詞訓練方法,包括:

獲取未標注樣本,計算所述未標注樣本中每個樣本點的不確定值;

根據所述每個樣本點的不確定值,將所述未標注樣本劃分為若干個子樣本,并根據不確定閾值獲取每個子樣本中分詞訓練的目標語料;

接收用戶對所述目標語料的標注操作,根據所述標注操作生成標注結果;

根據所述標注結果和預設模型,得到分詞訓練的目標模型。

可選地,所述獲取未標注樣本,計算所述未標注樣本中每個樣本點的不確定值,具體包括:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于普天信息技術有限公司,未經普天信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710229249.3/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: www亚洲精品| 精品国产一区二区三区四区四| 亚洲精品国产精品国产| 夜夜爽av福利精品导航| 在线国产一区二区| 中文字幕久久精品一区| 欧美一区二区色| 国产伦精品一区二区三区四区| 精品国产仑片一区二区三区| 亚洲欧美国产精品va在线观看| 国产精品日韩视频| 一本久久精品一区二区| 午夜毛片在线| 国产精品久久久久99| 亚洲国产精品入口| 亚洲天堂国产精品| 亚洲日韩欧美综合| 国产日韩欧美色图| 久久九九亚洲| 久久99久国产精品黄毛片入口 | 久久综合狠狠狠色97| 午夜色影院| 国产精品日韩三级| 日韩av在线网址| 在线精品国产一区二区三区| 国产综合久久精品| 欧美日韩一级在线观看| 97欧美精品| 日韩一级片免费观看| 国产一二三区免费| 亚洲制服丝袜中文字幕| 狠狠色噜噜狠狠狠狠色吗综合 | 91久久国产视频| 日韩a一级欧美一级在线播放| 91精品高清| 欧美精品日韩| 久久精品亚洲精品| 亚洲欧美一二三| 久久精品国产99| 日韩精品一区二区三区中文字幕| 91精品婷婷国产综合久久竹菊 | 久久国产精品-国产精品| 日韩欧美中文字幕一区| 九九视频69精品视频秋欲浓| 国产精品久久91| 久久精品99国产精品亚洲最刺激 | 国产极品美女高潮无套久久久| 99国产精品久久久久99打野战 | 91精品国产综合久久婷婷香| 国产精品一区二区在线观看免费| 91精品视频一区二区| 亚洲欧洲日韩av| 国产男女乱淫真高清视频免费| 久久乐国产精品| 国产精品久久久久久久久久久新郎 | 欧美日韩中文字幕一区二区三区| 欧美一级不卡| 91一区在线观看| 久久久精品观看| 欧美亚洲视频二区| 少妇久久精品一区二区夜夜嗨| 在线精品一区二区| 一区二区三区欧美视频| 国产一区免费在线观看| 青苹果av| 激情aⅴ欧美一区二区三区| 99久久国产免费,99久久国产免费大片| 国产精品日韩在线观看| 日韩欧美一区二区在线视频| 国产精品电影免费观看| 91久久精品在线| 狠狠色狠狠色综合日日2019 | 美女啪啪网站又黄又免费| 中文字幕一区二区三区四| 99久久精品国| 国产在线拍偷自揄拍视频 | 91精品一区二区中文字幕| 欧美在线视频一二三区| 99re久久精品国产| 91精品中综合久久久婷婷| 久久午夜鲁丝片午夜精品| 国产精品麻豆自拍| 亚洲精品久久久久中文第一暮| 国模少妇一区二区三区| 激情久久久| 日韩中文字幕在线一区二区| 性色av香蕉一区二区| 日韩av免费网站| 欧美精品久久一区| 国产视频一区二区视频| 亚洲w码欧洲s码免费| 欧美67sexhd| 99久久夜色精品国产网站| 91一区二区三区久久国产乱| 国产1区2区视频| 欧美日韩激情在线| 日日夜夜亚洲精品| 欧美精品中文字幕在线观看| 欧美日韩一级二级| 国产在线播放一区二区| 久久99精品国产99久久6男男| 欧美一区二区三区在线视频观看| 九九热国产精品视频| 欧美日韩中文字幕一区| 中文字幕日本精品一区二区三区| 国产一区二区午夜| 欧美一区二区三区久久久精品| 色就是色欧美亚洲| 国产一区免费播放| 香港日本韩国三级少妇在线观看 | 国产一区在线免费观看| 男女午夜影院| 欧洲在线一区二区| 国产精品欧美一区二区视频| 色婷婷噜噜久久国产精品12p| 特高潮videossexhd| 日本精品一区在线| 91黄在线看 | 亚洲va国产2019| 99久久婷婷国产精品综合| 国产精品久久久久久久久久不蜜月 | 久久99久久99精品免观看软件| 中文字幕精品一区二区三区在线| 欧美一区二区免费视频| 国产午夜精品一区二区三区四区| 亚洲午夜精品一区二区三区电影院| 久久国产精品久久| 亚洲区在线| 亚洲国产精品区| 国产精品对白刺激在线观看| 国产日韩一区在线| 午夜av电影网| 美女啪啪网站又黄又免费| 日韩精品久久久久久久电影99爱| 91秒拍国产福利一区| 国产69精品久久99不卡免费版 | 一区二区三区在线影院| 日本道欧美一区二区aaaa| 天堂av色婷婷一区二区三区| 少妇性色午夜淫片aaa播放5| 国产欧美一二三区| 97久久国产亚洲精品超碰热| 日韩一级片免费视频| 久久人做人爽一区二区三区小说 | 天干天干天啪啪夜爽爽99| 国产一区影院| 欧美日韩国产精品一区二区| 国产二区视频在线播放| 国产精品人人爽人人做av片| 久99久精品| 日本xxxxxxxxx68护士| 国产在线干| 日韩毛片一区| 欧美三区二区一区| 一区二区三区欧美精品| 91久久国语露脸精品国产高跟| 国产精品九九九九九| 国产精品中文字幕一区 | 久久久999精品视频| 国产日本一区二区三区| 久久一区二区视频| 欧美一级久久久| 亚洲精品中文字幕乱码三区91| 少妇又紧又色又爽又刺激的视频| 久久夜靖品2区| 午夜叫声理论片人人影院| 99精品区| 中文字幕日韩精品在线| 偷拍自中文字av在线| 韩国女主播一区二区| 91精品福利观看| 国产白丝一区二区三区| 欧美日韩中文不卡| 美女张开腿黄网站免费| 国产69精品久久久久999天美| 国产欧美一区二区三区不卡高清| 国产精品日韩电影| 欧美一区二区三区久久久精品| 91波多野结衣| 午夜伦全在线观看| 国产乱淫精品一区二区三区毛片| 狠狠躁夜夜躁2020| 91国产在线看| 欧美一区二区三区免费电影| 国产色一区二区| 国产精品视频一二区| 国产精品一区二区在线观看 | 国产视频在线一区二区| 国产精品久久久久久亚洲美女高潮| 91亚洲欧美日韩精品久久奇米色| 高清欧美精品xxxxx| 国产在线卡一卡二| 99久久国产综合精品尤物酒店| 视频一区二区三区欧美| 欧美一区二区三区免费电影| 欧美在线一区二区视频| 国产69久久| 乱淫免费视频| 亚洲国产一区二区久久久777| 国产精品国产三级国产播12软件| 99精品国产免费久久| 国产一区二区二| 欧美一区二区三区四区夜夜大片| 久久五月精品| 91国产在线看| 又色又爽又大免费区欧美| 91人人爽人人爽人人精88v| 国产日韩欧美中文字幕| 欧美精品一级二级| 国产在线视频99| 日韩av在线播放观看| 91av一区二区三区| 午夜伦理在线观看| 精品久久久久久亚洲综合网| 国产免费区| 精品少妇的一区二区三区四区| 68精品国产免费久久久久久婷婷| 亚洲精品国产setv| 99精品欧美一区二区| 狠狠躁夜夜| 午夜免费av电影| 亚洲欧美日本一区二区三区| 欧美一区二区三区精品免费| 色婷婷综合久久久久中文| 99久久免费精品视频| 国产精品v欧美精品v日韩| 大bbw大bbw巨大bbw看看| 日韩一级在线视频| 国产午夜精品一区二区理论影院| 欧美系列一区| free性欧美hd另类丰满| 一区二区三区日韩精品| 91理论片午午伦夜理片久久| 中文字幕欧美日韩一区 | 91精品色| 欧美资源一区| 99精品区| 欧美三区视频| 午夜看片在线| 国产伦精品一区二区三区免| 国产理论一区| 性欧美一区二区| 欧美3p激情一区二区三区猛视频| 夜夜夜夜曰天天天天拍国产| 国产91热爆ts人妖在线| 欧美日韩精品在线一区二区|