日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種采用上下文特征匹配的中文機構名簡稱識別系統無效

專利信息
申請號: 201410261878.0 申請日: 2014-06-12
公開(公告)號: CN104035918A 公開(公告)日: 2014-09-10
發明(設計)人: 楊靜;郝娟;潘云;裴逸鈞;杜澤宇 申請(專利權)人: 華東師范大學
主分類號: G06F17/27 分類號: G06F17/27
代理公司: 上海藍迪專利事務所 31215 代理人: 徐筱梅;張翔
地址: 200241 *** 國省代碼: 上海;31
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 采用 上下文 特征 匹配 中文 機構 簡稱 識別 系統
【說明書】:

技術領域

????本發明涉及自然語言處理技術領域,具體地說是一種基于上下文特征的機構名簡稱識別系統。

背景技術

命名實體識別已經成為自然語言處理中的一項基本任務,在信息抽取、句法分析、機器翻譯工作中,擔任著重要的角色。命名實體中的人名、地名、機構名是最重要的三類,目前,前兩種的識別研究已經非常廣泛細致,對機構名進行準確、高效的識別具有重要意義。在文本中,簡稱是一種普遍存在的語法現象,但是由于機構名簡稱的組成形式多樣、規律性不強、同一全稱可能有多個簡稱等特點,導致對其識別困難重重。

目前來看,機構名簡稱識別方法可以分為兩類—基于規則的方法和基于統計的方法。但是無論是哪一種識別方法,機構名簡稱的獲得都依賴于全稱,如果語料中不包含機構名簡稱對應的全稱,那么該機構名簡稱將無法被識別。另外,默認組成簡稱的漢字也都來自于全稱并且與在全稱中的順序保持一致,這就造成不符合上述條件的簡稱難以被識別。如“成電”是“電子科技大學”的簡稱,因為“成”并不是全稱中的漢字,所以簡稱“成電”將不會被識別。又如“北醫三院”是“北京大學第三醫院”的簡稱,“醫”和“三”的順序與在全稱中不一致,因此“北醫三院”也很難被識別。

發明內容

本發明的目的是針對現有技術中的缺陷而提供的一種采用上下文特征匹配的中文機構名簡稱識別系統,該系統既不依賴機構名全稱知識庫,也不依賴機構名簡稱的組成形式,而是利用機構名的上下文特征對機構名簡稱進行識別。

????實現本發明目的的具體技術方案是:

????一種采用上下文特征匹配的中文機構名簡稱識別系統,該系統包括訓練模塊及識別模塊,其中:

所述訓練模塊:以某一新聞語料作為訓練集,從訓練集訓練得到機構名的上下文特征即相交特征集與機構名獨有特征集以及干擾詞表;

所述識別模塊:以與訓練集不同的新聞語料作為測試集,在測試集中采用機構名上下文特征匹配算法對機構名簡稱識別;首先,在錯誤率???????????????????????????????????????????????的取值范圍下,使用相交特征集與機構名獨有特征集中的特征與句子進行匹配,識別候選機構名簡稱;然后,使用final-words去除掉候選機構名簡稱中的干擾詞,得到較準確的機構名簡稱;最后,利用擴展操作,召回文中部分未被識別出的簡稱。

????所述訓練模塊中訓練得到機構名的上下文特征,具體包括:

1)訓練得到機構名的三種上下文特征:前特征、后特征、弱可信特征對,機構名的上下文特征由詞語以及詞性組成;以某一新聞語料庫詞性標注為準則認定標記為名詞n、名語素Ng、成語i詞性的詞語具有實際含義,被定義為強特征,標記為助詞u、介詞p詞性的詞語不具備實際的含義,被定義為弱特征;把出現在機構名上文的強特征定義為前特征,出現在機構名下文的強特征定義為后特征;把上下文都是弱特征的詞語當作一個特征,定義為弱特征對;機構名上下文特征是由前特征、后特征和弱特征對3類特征構成;只選擇緊跟在機構名前后的一個詞語作為上下文特征;

2)將成語、動名詞詞語作為干擾詞,以所述1)同樣形式獲得干擾詞的3類上下文特征;

3)將機構名的3類上下文特征分別與干擾詞的3類上下文特征相交,相交的部分為相交特征集,在機構名的特征集中除去相交部分就是機構名獨有特征集;每一個相交特征的錯誤率根據公式(1)得出,每一個機構名獨有特征的錯誤率為0;

??????1,?2,?3,?……??????(1)

其中,是指出現在特征之間的詞語為干擾詞的總次數,是指出現在特征之間的詞語為機構名的總次數。

????所述訓練模塊中訓練得到干擾詞表,具體包括:

從某一新聞訓練語料中把長度在3-6個字的干擾詞全部找到,當作候選干擾詞;并對候選干擾詞進行如下擴展:

1)通過加入中國的姓氏補充名詞干擾詞;

2)通過加入一些地名的尾字補充名詞干擾詞;?

再對候選干擾詞進行過濾處理:

1)對于中國姓氏:與某一新聞訓練語料中的每個簡稱的首字進行一一比對,如果中國姓氏與所有簡稱的首字都不匹配,把其加入到干擾詞表中;

2)對于地名尾字:與訓練語料中的每個簡稱的最后一個尾字進行一一比對,如果地名尾字與所有簡稱的尾字都不匹配,把其加入到干擾詞表中;

得到了干擾詞表final-words。

???所述識別模塊中采用機構名上下文特征匹配算法對機構名簡稱識別,具體包括:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410261878.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 午夜毛片影院| 日韩欧美精品一区二区| 国语对白一区二区| 国产精欧美一区二区三区久久久| 欧美午夜理伦三级在线观看偷窥| 国产精品美女久久久免费| 国产第一区二区| 国产精品视频1区| 国产高清在线观看一区| 538国产精品一区二区| 国产又色又爽无遮挡免费动态图| 久久久久久亚洲精品| 国产一二区在线观看| 国产精品一二三区免费| 色婷婷精品久久二区二区我来| 国产一区免费在线观看| 午夜在线观看av| 日日噜噜夜夜狠狠| 日本一区二区三区电影免费观看| 日韩精品少妇一区二区在线看| 国产精品无码永久免费888| 国产乱淫精品一区二区三区毛片| 99久久婷婷国产综合精品草原 | 99爱国产精品| 亚洲国产精品激情综合图片| 搡少妇在线视频中文字幕| 日日夜夜一区二区| 麻豆天堂网| 亚洲精品一区二区三区98年| 精品欧美一区二区在线观看| 午夜色影院| 国产乱子伦农村xxxx| 福利视频亚洲一区| 国模一区二区三区白浆| 国产精品视频免费一区二区| ass韩国白嫩pics| 久久中文一区二区| 久久亚洲精品国产一区最新章节| 国产一区二区伦理片| 国产区二区| 日本亚洲国产精品| 一本久久精品一区二区| 一区不卡av| 精品a在线| 国产精品久久91| 国产全肉乱妇杂乱视频在线观看| 91丝袜国产在线播放| 欧美日韩一区在线视频| 国产的欧美一区二区三区| 国产午夜伦理片| 国产精品日韩一区二区| 欧美日韩一区二区高清| 日本二区在线观看| 欧美日韩久久一区| 久久一区二| 男女午夜爽爽| 国产亚洲精品精品国产亚洲综合| 麻豆天堂网| 精品福利一区| 欧美日韩一区二区三区在线播放| 国产午夜一区二区三区| 欧美一区二区三区免费视频| 国产日韩欧美另类| 欧美日韩一区二区三区不卡视频| 国产玖玖爱精品视频| 99精品视频一区二区| 欧美精品在线视频观看| 99久久久国产精品免费调教网站| 久久噜噜少妇网站| 综合欧美一区二区三区 | 国产一区在线视频观看| 国产精品亚洲第一区| 少妇bbwbbwbbw高潮| 在线精品国产一区二区三区88| 欧美日韩精品在线一区| 久久久一二区| 亚洲精品久久在线| 国产日韩欧美二区| 日本不卡精品| 在线精品国产一区二区三区88| 欧美精品中文字幕亚洲专区| 国产又色又爽无遮挡免费动态图| 精品91av| 国产一区二区在线91| 久久一二区| 一色桃子av| 欧美一区二区三区艳史| 天摸夜夜添久久精品亚洲人成| 99国产伦精品一区二区三区 | 国产超碰人人模人人爽人人添| 九九精品久久| 狠狠躁天天躁又黄又爽| 91丝袜国产在线播放| 国产91电影在线观看| 日本高清h色视频在线观看| 女人被爽到高潮呻吟免费看| 久久久久亚洲国产精品| 一区二区三区欧美在线| 国产欧美日韩精品在线| 粉嫩久久99精品久久久久久夜| 黄色国产一区二区| 狠狠色很很在鲁视频| 国产精品久久久久久久久久久久冷| 国产性生交xxxxx免费| 午夜色大片| 在线精品一区二区| 狠狠色噜噜狠狠狠四色米奇| 91波多野结衣| 91丝袜国产在线播放| 国产欧美日韩在线观看| 久久午夜鲁丝片午夜精品| 欧美日韩亚洲另类| 91久久国产视频| 午夜激情免费电影| 99精品久久久久久久婷婷| 亚洲w码欧洲s码免费| 高清国产一区二区三区| av午夜在线| 精品久久9999| 午夜毛片影院| 狠狠色噜噜狠狠狠狠2021免费| 国产精品乱战久久久| 日韩欧美中文字幕精品| 中文无码热在线视频| 国产aⅴ一区二区| 国产精品高潮呻吟三区四区| 国产一区二区三区伦理| 97精品国产97久久久久久免费| 午夜影院5分钟| 国产精品96久久久| 在线观看欧美一区二区三区| 国产免费一区二区三区四区| 国产高清在线观看一区| 国产99小视频| 欧美xxxxhdvideos| 久久国产精品视频一区| 国产一级精品在线观看| 麻豆天堂网| 欧美一区二区三区不卡视频| 99精品欧美一区二区三区美图| 99精品视频一区| 欧美在线视频一二三区| 国产日产欧美一区| 国产精品精品国内自产拍下载| 亚洲精品日本久久一区二区三区| 亚洲国产aⅴ精品一区二区16| 午夜av免费看| 国产www亚洲а∨天堂| 国产一区二区三区大片| 久久99中文字幕| 午夜在线看片| 国产欧美一区二区三区在线播放| 久久人做人爽一区二区三区小说 | 少妇高潮一区二区三区99小说| 日韩亚洲精品在线| 国产在线精品一区二区| 99国产精品永久免费视频| 国产精品视频久久| 午夜精品999| 亚洲精品久久久久www| xxxxhdvideosex| 欧美日韩国产在线一区二区三区 | 中文字幕亚洲欧美日韩在线不卡| 久久精品亚洲精品| 亚洲精品丝袜| 夜夜躁日日躁狠狠久久av| 69精品久久| 97香蕉久久国产超碰青草软件| 色一情一乱一乱一区99av白浆| 中文字幕一区二区三区四| 欧美xxxxxhd| 四虎影视亚洲精品国产原创优播| 亚洲国产精品一区在线| 亚洲欧洲一二三区| 国产高清无套内谢免费| 国产精品国精产品一二三区| 日本精品一二三区| 首页亚洲欧美制服丝腿| 国产在线一卡二卡| 午夜激情电影院| 国产视频一区二区在线| 国产91热爆ts人妖系列| 日韩欧美国产另类| 欧美日韩一级在线观看| 年轻bbwwbbww高潮| 免费**毛片| 国产91免费观看| 国产一区在线视频播放| 999亚洲国产精| 91麻豆精品一区二区三区| 欧美日韩一区二区三区四区五区| 日本精品一区在线| 在线精品视频一区| 丝袜美腿诱惑一区二区| 国产丝袜一区二区三区免费视频| 国产大片黄在线观看私人影院| 日本久久丰满的少妇三区| 欧美激情在线一区二区三区| 国产精品一区二区中文字幕| 国产精品女人精品久久久天天| 欧美午夜精品一区二区三区| 国产偷窥片| 久久综合二区| 免费久久一级欧美特大黄| 久久99国产视频| 国产一区二区三区中文字幕| 国产理论一区二区三区| 欧美日韩一区二区三区免费| 亚洲乱码一区二区三区三上悠亚| 国产午夜精品一区理论片飘花| 久久精品国语| 激情久久一区| 国产精品一区二区在线看| 午夜国产一区二区三区四区| 福利片一区二区三区| 日本一区二区在线电影| 一级午夜电影| 久久久久国产精品免费免费搜索| 久久久久国产精品www| 国产三级在线视频一区二区三区| 国产主播啪啪| 国产特级淫片免费看| 欧美日韩精品在线一区二区| 精品国产品香蕉在线| 99re久久精品国产| 日韩夜精品精品免费观看| 国产欧美一区二区在线观看| 日本一区二区免费电影| 欧美在线视频一区二区三区| 国产九九九精品视频| 色一情一乱一乱一区99av白浆| 制服丝袜二区| 在线视频不卡一区| 午夜裸体性播放免费观看| 日韩毛片一区| 午夜精品一区二区三区三上悠亚| 首页亚洲欧美制服丝腿| 久久夜靖品2区| 国产一区激情| 亚洲va久久久噜噜噜久久0| 99久精品视频| 亚洲国产精品入口| 国产91在线拍偷自揄拍| 91精品丝袜国产高跟在线| 中文字幕a一二三在线| 精品久久久影院|