日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于決策樹規則和多種統計模型相結合的人名識別算法有效

專利信息
申請號: 201410060957.5 申請日: 2014-02-21
公開(公告)號: CN103823859B 公開(公告)日: 2017-02-22
發明(設計)人: 鄭中華;周俊;周銀行 申請(專利權)人: 安徽博約信息科技股份有限公司
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 暫無信息 代理人: 暫無信息
地址: 230000 安徽省合肥市*** 國省代碼: 安徽;34
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 決策樹 規則 多種 統計 模型 相結合 人名 識別 算法
【說明書】:

技術領域

發明涉及一種基于決策樹規則和多種統計模型相結合的人名識別算法。

背景技術

自然語言處理是互聯網信息搜索領域的核心分析技術,在搜索引擎、輿情監控以及電子商務等眾多互聯網IT產業都有廣泛的應用。隨著互聯網信息指數級增長以及用戶體驗需求越來越高,在保證處理速度滿足用戶使用需求的前提下,互聯網信息搜索對自然語言處理結果的要求越來越精準。人名識別是自然語言處理詞法分析中最困難的核心問題之一,不管在搜索引擎領域還是在輿情監控領域,用戶對人名、地名和機構名等實體詞的關注度遠高于常用詞,而且人名作為無法直接采用詞典匹配識別的未登錄詞,識別難度大,因此,一直以來都是備受關注的研究問題。

所謂人名識別,在本文中是指針對給定漢語句子,準確地標出句中所含所有完整人名,包括姓氏和名字,而對于指代人物的身份詞,姓氏指代詞或無姓人名則不用標出,因為身份詞、姓氏指代詞和無姓人名通常指代一類人而不是一個人,且一般用于非正式場合,用戶關注度并不高,故不在本文人名識別范圍內。如給定句子“揭景崗山二婚娶李亞鵬經紀人”,需要標出人名“景崗山”和“李亞鵬”;又如“媽媽告訴兒子鵬鵬做人要誠實”,“李考上大學”等句子中,身份詞“媽媽”和“兒子”,姓氏指代詞“李”,無姓人名“鵬鵬”都不用標出。

現有的技術方案如下:

基于統計機器學習和基于統計與規則相結合是目前最主流的人名識別方法,基于統計機器學習的人名識別方法通過定義語義角色對語言文本的詞序列進行角色標注,然后利用統計模型對文本中出現的語義角色進行建模與計算,最終得到人名的識別結果,由于該方法實現難度小,且一致性好,故而得到廣泛的應用。基于統計與規則相結合的人名識別方法是在基于統計機器學習的基礎上,加上啟發式規則,對統計模型的識別結果進行修正,以提升綜合識別效果。由于統計模型僅從整體考慮,可能抑制局部小概率事件的發生,而且訓練語料庫也存在信息不全面等局限,導致統計信息存在誤差,造成很多人名遺漏識別或錯誤識別,因此需要結合一些啟發式規則進行召回和剔除,以彌補統計模型的不足。

從圖1中可以看出,基于統計機器學習的人名識別方法主要包括離線統計和在線識別兩部分。

離線統計指離線完成統計模型的參數訓練,主要包括角色定義與信息統計和統計模型構建與訓練兩項工作,角色定義根據人名的構成特征和上下文特征定義語義角色,一般包括人名姓氏,人名用字,上文特征以及下文特征等,如“演員周星馳擔任政協委員”,“演員”為上文特征,“周”為姓氏,“星”和“馳”為人名用字,“擔任”為下文特征,角色信息統計則根據人名庫和訓練語料庫統計所有的人名姓氏,人名用字等角色信息;統計模型構建和參數訓練指根據定義的語義角色,構建合適的統計模型,如隱馬爾科夫模型,條件隨機場模型,位置概率模型以及貝葉斯模型等,然后利用訓練語料庫計算統計模型中常數參數值。

在線識別指根據輸入的語言文本,標注其中所含有的所有人名并輸出。在線識別過程如下:1)選用合適的粗分算法,如N-Gram、最大匹配算法等,將輸入的連續漢語語言文本字符串切分為詞序列;2)采用離線統計的角色詞庫對詞序列執行角色識別,即標注出語言文本中出現的所有人名語義角色;3)采用已訓練的統計模型,對文本中出現的語義角色進行分析與計算,并得出識別結果;4)采用啟發式規則對識別結果進行召回和剔除,召回遺漏識別,剔除錯誤識別,本步驟可無;5)輸出語言文本中人名的識別結果。

現有技術的缺點是:

1)采用單一統計模型,綜合識別效果差。由于人名構成特征和上下文特征復雜,不具備統一特征,現有技術采用單一模型無法覆蓋所有人名構成特征和上下文特征,且出現規則沖突概率較大,導致綜合識別效果差。

2)識別效果過于依賴訓練語料庫,可靠性低。對統計模型來說,訓練語料庫的普適性和全面性直接影響模型參數的可靠性,從而決定最終的識別效果,而內容全面,涵蓋所有人名構成特征和上下文特征的語料庫幾乎不存在,而現有技術采用的主要為統計模型,故而過于依賴經驗主義,可靠性較低。

3)綜合識別效率低。語言文本中出現的相當一部分人名角色可通過規則快速排除,或者通過更簡單的統計模型即可高效準確的識別,而現有技術對所有標注的人名角色采用同一種統計模型進行計算,故而綜合識別效率低。

發明內容

本發明要解決的技術問題是漢語語言文本中的中國人名識別問題。

為了解決上述技術問題,本發明采用的技術方案是:基于決策樹規則和多種統計模型相結合的人名識別算法,包括離線統計和在線識別兩個過程:

1.離線統計

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽博約信息科技股份有限公司,未經安徽博約信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410060957.5/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久久久久亚洲精品| 日韩av在线影院| 婷婷午夜影院| 日韩精品一区二区不卡| 欧美大片一区二区三区| 99精品视频一区二区| 国产一区二区三区的电影| 久久久久久中文字幕| 亚洲欧美制服丝腿| 99日本精品| 中文字幕天天躁日日躁狠狠躁免费| 亚洲欧美精品suv| 国产一区午夜| 国产免费观看一区| 午夜看片网| 精品999久久久| 中文字幕一区二区在线播放| 国产欧美一区二区在线观看| 精品久久久久99| 国产免费一区二区三区网站免费| 国产乱对白刺激视频在线观看| 国产偷久久一区精品69| 亚洲午夜精品一区二区三区电影院| 色乱码一区二区三区网站| 国产亚洲精品久久久久久网站| 中文字幕一区三区| 国产精品v欧美精品v日韩| 欧美乱码精品一区二区| 91久久国产露脸精品| 99久久国产综合精品女不卡| 国产69精品久久久久久久久久| 欧美精品一区免费| 中文字幕日韩一区二区| 国产乱子伦农村xxxx| 亚洲高清毛片一区二区| 亚洲制服丝袜中文字幕| 国产精品免费一区二区区| 精品久久国产视频| 精品久久综合1区2区3区激情| 毛片大全免费观看| 欧美福利一区二区| 国产区一区| 欧美一区二区三区艳史| 狠狠色综合欧美激情| 国产精品视频久久久久久| 美国三级日本三级久久99| 中文字幕制服丝袜一区二区三区| 午夜老司机电影| 国产精品视频一区二区二| 久久国产精品欧美| 国产精品久久99| 国产精品1234区| 欧美精品日韩| 九九热国产精品视频| 日韩一级片免费观看| 99精品黄色| 欧美精品久| 国产高清在线一区| 欧美精品免费视频| 玖玖玖国产精品| 日本丰满岳妇伦3在线观看| 国产又黄又硬又湿又黄| 国产亚洲精品久久久久动| 国产乱色国产精品播放视频| 国产1区2| 午夜国产一区二区三区四区| 狠狠色狠狠色综合日日2019| 欧美极品少妇| 国产一级一区二区| 久久久久久久久亚洲精品一牛| 国产亚洲精品久久网站| 久久第一区| 91黄在线看| 国产欧美日韩精品一区二区三区| 一级久久久| 国产精品久久久久久久久久嫩草| 91片在线观看| 强制中出し~大桥未久10| 久久精品亚洲精品| 日韩精品一区二区三区在线| 四虎精品寂寞少妇在线观看| 日本伦精品一区二区三区免费| 欧美hdxxxx| 视频一区二区三区欧美| 精品国产乱码一区二区三区在线| 久久久久久久国产| 中文字幕在线乱码不卡二区区| 久久久久国产亚洲日本| 一区二区久久久久| 国产在线拍揄自揄拍| av午夜电影| 少妇又紧又色又爽又刺激的视频| 福利视频亚洲一区| 日韩毛片一区| 国产一区精品在线观看| 午夜激情在线| 国内自拍偷拍一区| 午夜免费一级片| 国产乱码一区二区| 国产麻豆一区二区三区精品| 日韩亚洲国产精品| 日韩av在线播| 欧美一区二区三区高清视频| 在线国产精品一区二区| 四季av中文字幕一区| 精品国产一区二| 91亚洲精品国偷拍自产| 玖玖玖国产精品| 色一情一乱一乱一区免费网站 | 久久91久久久久麻豆精品| 精品少妇一区二区三区| 欧美日韩一区二区三区在线观看视频 | 日本大码bbw肉感高潮| 日韩av在线资源| 夜夜嗨av禁果av粉嫩av懂色av| 国产毛片精品一区二区| 一区二区三区香蕉视频| 久久国产精品99国产精| 亚洲国产欧美一区二区丝袜黑人| 欧美日韩一区二区三区在线播放| 国产欧美一区二区三区在线看| 91嫩草入口| 日韩三区三区一区区欧69国产| 狠狠色狠狠色综合久久第一次| 国产在线拍偷自揄拍视频| 日韩av视屏在线观看| 亚洲美女在线一区| 国产高清精品一区| 久久精品国产色蜜蜜麻豆| 国产一区二区三区小说| 九九精品久久| 欧美一区二区三区免费看| 日韩av片无码一区二区不卡电影| 狠狠色噜噜狠狠狠888奇米| 小萝莉av| 欧美精品一卡二卡| 午夜影院啊啊啊| 日本一区二区三区在线视频| 欧美日韩一区不卡| 日韩中文字幕在线一区| 99精品视频一区二区| 日韩精品一区在线视频| 国产午夜精品免费一区二区三区视频| 91超碰caoporm国产香蕉| 久久伊人色综合| 色噜噜狠狠狠狠色综合久| 91精品啪在线观看国产线免费| 精品国产一级| 精品国产91久久久| 欧美日韩综合一区| 女女百合互慰av| 午夜伦全在线观看| 福利电影一区二区三区| 国产清纯白嫩初高生在线观看性色| 亚洲乱小说| 国产一区二区中文字幕| 欧美精品在线视频观看| 亚洲免费永久精品国产| xxxxhdvideosex| 中文字幕日本精品一区二区三区| 国产精品黑色丝袜的老师| 午夜激情看片| 国产精华一区二区精华| av午夜影院| 奇米色欧美一区二区三区| 欧美久久一区二区三区| 日韩欧美国产另类| 日本少妇高潮xxxxⅹ| 日韩精品一区中文字幕| 91精品视频在线免费观看| 国产午夜一级一片免费播放| 黄色香港三级三级三级| 久久精品99国产精品亚洲最刺激| 午夜老司机电影| 欧美亚洲视频一区| 香港三日本三级三级三级| 中文乱幕日产无线码1区| 亚洲精品乱码久久久久久蜜糖图片| 91波多野结衣| 久久精品99国产精品亚洲最刺激| 精品国产一区二| 欧美日韩一级二级三级| 99er热精品视频国产| 国产精品日韩一区二区| 挺进警察美妇后菊| 一区二区三区国产欧美| 97涩国一产精品久久久久久久| 国产精品麻豆自拍| 国产精品一级片在线观看| 欧美日韩一区不卡| 91看黄网站| 国产精品视频免费一区二区| 国产va亚洲va在线va| 欧美日韩九区| 狠狠躁夜夜av| 国产精品网站一区| 强制中出し~大桥未久4| 日本三级香港三级网站| av不卡一区二区三区| 久久中文一区二区| 日本一级中文字幕久久久久久| 亚洲一区二区国产精品| 真实的国产乱xxxx在线91| 国产精品欧美久久久久一区二区 | 少妇高潮ⅴideosex| 国产精品99999999| 国产日韩欧美亚洲| 99久久夜色精品国产网站| 欧美日韩一区电影| 亚洲欧美日韩精品在线观看| 亚洲少妇中文字幕| 99国产精品永久免费视频 | 国产精品午夜一区二区| 免费看性生活片| 久久久久国产精品一区二区三区| 88888888国产一区二区| 国产91热爆ts人妖系列| 久久久久久亚洲精品| 国产精品九九九九九九| 国产一区二区午夜| 欧美一区二区三区性| 日韩欧美国产高清91| 精品久久久久一区二区| 日本少妇高潮xxxxⅹ| 久免费看少妇高潮a级特黄按摩| 午夜毛片电影| 亚洲精华国产欧美| 国产区图片区一区二区三区| 欧洲激情一区二区| 国产91精品一区二区麻豆亚洲| 国产午夜精品一区二区三区在线观看| 国产69精品久久久久app下载| 狠狠色噜噜狠狠狠狠88| 国产免费一区二区三区四区五区 | 国产日韩精品久久| 国产在线一区不卡| 538国产精品一区二区免费视频| 久久综合二区| 亚洲精品乱码久久久久久高潮| 99国产精品欧美久久久久的广告| 国产男女乱淫视频高清免费| 91精品视频在线观看免费| 亚洲高清久久久| 欧美一级日韩一级| 国产的欧美一区二区三区 | 少妇太爽了在线观看免费|