日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種詞形還原方法及裝置有效

專利信息
申請號: 201210075356.2 申請日: 2012-03-21
公開(公告)號: CN103324608A 公開(公告)日: 2013-09-25
發明(設計)人: 何徑舟;王曉露 申請(專利權)人: 北京百度網訊科技有限公司
主分類號: G06F17/27 分類號: G06F17/27
代理公司: 北京鴻德海業知識產權代理事務所(普通合伙) 11412 代理人: 袁媛
地址: 100085 北京市*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 詞形 還原 方法 裝置
【說明書】:

技術領域

發明涉及自然語言處理技術領域,特別是涉及一種詞形還原方法及裝置。

背景技術

根據詞的結構與構成語素之間的關系,一般把世界上的語言分成孤立語、粘著語、屈折語、復綜語四種類型。其中,曲折語的特點是以豐富的詞形變化來表示詞語間的語法關系,常見的屈折語例如英語、法語、俄語等等。

英文作為一種屈折語,存在大量包括單復數、時態、比較級、所有格等在內的一系列復雜的詞形變換現象。因此,對于英文進行詞形分析,往往是進行各種英文處理(例如常用詞組識別、名詞短語識別、命名實體分析)的基礎。而在很多具體的應用中,同樣需要用到詞形分析技術,例如,用戶在進行網頁搜索操作時,提交的query是“smoking?detector”,那么對于搜索引擎而言,可能需要返回包含“smoke’s?detector”、“smoke?detector”、“smoke?detect”等等的網頁結果,這些都是“smoking?detector”的不同詞形表現形式。

由于英文存在詞形變換現象,同一個詞組或命名實體可能有多種表現形式。如常用詞組take?care,在實際使用中可能表現為takes?care、took?care、taken?care、take?cares等等形式。受詞典規模所限,不能簡單將這些形式窮舉(受指數規律影響,單詞數為n的詞組,如果其中每個單詞有m種詞形變換,那么整個詞組的詞形變換形式將有O(mn)之多)。因此一般來說,會先對英文單詞進行詞根還原操作,即先將英文單詞的實際表現形式還原為詞根形式,再進行后續處理。

但是,詞根還原并不能完全等同于詞形還原,詞形還原需要把一個任何形式的英語單詞還原到一般形式,而詞根還原只是抽取一個單詞的詞根。因此,現有的利用詞根還原算法實現詞形還原的技術普遍存在過還原(overstemming)現象:即指將詞條還原為過于簡單的詞根,從而導致語義的轉義或歧義等問題。舉例說明如下:

“probable(可能)→probe(探頭)”,從規則上來說沒問題,但是語義發生了變化,從而導致轉義問題;

“animal(動物)→anim”和“animation(動畫)→anim”,詞根都是anim,但是和原形的含義并不一樣,從而導致歧義問題。

發明內容

為解決上述技術問題,本發明實施例提供一種詞形還原方法及裝置,以解決現有的詞形還原算法所存在的過還原問題。技術方案如下:

本發明實施例提供一種詞形還原方法,其特征在于,包括:

對待還原詞條進行詞根還原,獲取詞根還原算法各步驟的輸出結果加入還原候選集合;

對于每個還原候選,分別計算該還原候選相對于所述待還原詞條的還原概率;

根據還原概率的大小,確定所述待還原詞條的詞形還原結果。

在本發明的一種實施方式中,在對待還原詞條進行詞根還原之前,還包括:

利用預置的免還原詞表對所述待還原詞條進行過濾,

若所述待還原詞條在所述免還原詞表中,則停止后續步驟。

在本發明的一種實施方式中,在對待還原詞條進行詞根還原之前,還包括:

利用預置的不規則詞表對所述待還原詞條進行過濾,

若所述待還原詞條在所述不規則詞表中,則根據所述不規則詞表,將所述待還原詞條的原型加入還原候選集合。

在本發明的一種實施方式中,在計算原候選相對于待還原詞條的還原概率之前,還包括:

對還原候選進行過濾,去除不合理的還原候選。

在本發明的一種實施方式中,所述對還原候選進行過濾,包括:

判斷還原候選是否屬于預置的詞干白名單,如果否,則去除該還原候選。

在本發明的一種實施方式中,所述對還原候選進行過濾,包括:

比較待還原詞條與還原候選的差異部分,判斷該差異部分是否屬于預置的詞綴黑名單,如果是,則去除該還原候選。

在本發明的一種實施方式中,在存在多個詞形還原結果的情況下,上述方法還包括:

統計每個詞形還原結果的還原概率、以及該詞形還原結果與待還原詞條上下文內容的語言模型共現概率;

對于每個詞形還原結果,計算其靜態還原概率與共現概率的乘積;

選擇乘積最大的詞形還原結果作為最終輸出的詞形還原結果。

本發明實施例還提供一種詞形還原裝置,包括:

詞根還原單元,用于對待還原詞條進行詞根還原,獲取詞根還原算法各步驟的輸出結果加入還原候選集合;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210075356.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美日韩三区二区| 99精品视频一区二区| 日韩精品一区在线观看| 亚洲乱亚洲乱妇50p| 国产99久久九九精品免费| 国产精品久久久麻豆| 午夜免费av电影| 九九热国产精品视频| 国产欧美日韩综合精品一| 国产精品一级在线| 亚洲一二三在线| 亚洲在线久久| 欧美一区二区三区精品免费| 亚洲第一天堂久久| xxxxhdvideosex| 欧美在线视频一二三区| 99国产精品一区| 久久一区欧美| 久久99精品国产麻豆宅宅| 99国产精品久久久久老师| 狠狠色综合欧美激情| 少妇高潮ⅴideosex| 男人的天堂一区二区| 国产欧美三区| 国产一区=区| 亚洲精品乱码久久久久久高潮| 国产一区二区三区小说| 欧美二区精品| 日韩av免费电影| 一区二区三区欧美精品| 少妇太爽了在线观看免费| 国产日韩欧美第一页| 精品国产一区二区三区麻豆免费观看完整版 | 日韩精品免费看| 97国产精品久久久| 国产精品一区在线播放| 亚洲女人av久久天堂| 农村妇女精品一二区| 亚洲欧美国产日韩色伦| 91超碰caoporm国产香蕉| 91黄色免费看| 亚洲**毛茸茸| 91麻豆文化传媒在线观看| 亚洲精品人| 久久久精品a| 99久久www免费| 久久久久国产亚洲日本| 国精产品一二四区在线看| 秋霞三级伦理| 91麻豆产精品久久久| 国产福利一区在线观看| 日韩精品免费一区二区中文字幕| 一区二区三区四区视频在线| 国产精品理人伦一区二区三区| 国产精品一区二区三区在线看| 亚欧精品在线观看| 99久久精品免费视频| 精品国产一区二区三区免费| 久久久精品久久日韩一区综合| 国产伦精品一区二区三区免费观看| 亚洲精品乱码久久久久久写真| 97人人揉人人捏人人添| 国产在线一区不卡| 97久久精品人人做人人爽| 日本一区二区免费电影| 日韩一级免费视频| 91麻豆国产自产在线观看hd| 99久久国产综合| 国产91在线播放| 亚洲一区欧美| 狠狠色噜噜综合社区| 91麻豆精品国产91久久久无限制版| 少妇bbwbbwbbw高潮| 国产伦理久久精品久久久久| 午夜av片| 久久久中精品2020中文| www亚洲精品| 亚洲欧美一卡二卡| 中文字幕理伦片免费看| 久久精品99国产国产| 综合国产一区| 久久综合伊人77777麻豆| 国语对白一区二区| 国产欧美精品一区二区三区-老狼| 亚洲国产精品91| 国产精品无码永久免费888| 午夜亚洲国产理论片一二三四| 精品久久久久久久久亚洲| 亚洲精品乱码久久久久久高潮| 久久精品一二三| 四虎国产精品永久在线| 精品福利一区二区| 欧美一区二区三区三州| 午夜电影三级| 亚洲国产精品一区在线| 国产精品视频久久久久| 日韩久久精品一区二区三区| 欧美日韩一区二区三区不卡视频| 色综合久久精品| 精品国产乱码一区二区三区在线 | 亚洲日韩欧美综合| 国产一区二区极品| 国产88久久久国产精品免费二区| 欧美日韩中文国产一区发布 | 日本边做饭边被躁bd在线看| 国产精品欧美一区二区视频| 鲁丝一区二区三区免费| 国产极品美女高潮无套久久久| 国产精品免费观看国产网曝瓜| 国产精品欧美一区二区三区| 91国偷自产一区二区介绍| 99爱精品在线| 狠狠色丁香久久婷婷综合丁香| 日本福利一区二区| 在线视频国产一区二区| 国产乱老一区视频| 国产大片一区二区三区| 国产一区二区三区大片| 亚洲女人av久久天堂| 91麻豆精品国产91久久久更新资源速度超快| 久久国产精品波多野结衣| 国产乱人伦精品一区二区三区| 久久青草欧美一区二区三区| 97精品国产aⅴ7777| 国产精品视频十区| 亚洲乱在线| 99riav3国产精品视频| 性old老妇做受| 欧美三区视频| 国产日韩一区二区在线| 日本高清h色视频在线观看| 国产一区二区三区午夜| 窝窝午夜理伦免费影院| 亚洲欧美另类综合| 欧美午夜一区二区三区精美视频| 日韩精品中文字幕一区二区| 激情久久久久久| 国产精品高潮呻吟三区四区| 日韩欧美视频一区二区| 人人要人人澡人人爽人人dvd| 国产91电影在线观看| 中文字幕区一区二| 91片在线观看| 国产欧美性| 97视频一区| 夜夜嗨av色一区二区不卡| 一本一道久久a久久精品综合蜜臀| 日韩av在线免费电影| 欧美精品日韩| 中文字幕一区二区三区乱码| 久久密av| 91麻豆精品国产自产欧美一级在线观看| 国产伦理一区| 久久不卡精品| 欧美xxxxxhd| 国产精品综合一区二区| 亚洲国产偷| 国产精品视频久久久久久| 欧美日韩国产精品一区二区亚洲| 欧美一级久久久| 国产1区2区3区| 亚洲国产欧美国产综合一区| 欧美午夜理伦三级在线观看偷窥| 国产日韩欧美综合在线| 国产老妇av| 国产www亚洲а∨天堂| 91精品国产九九九久久久亚洲| 国产乱子一区二区| 91秒拍国产福利一区| 国产一区二区在线免费| 国产白丝一区二区三区| 欧美日韩国产一二| 国产免费一区二区三区网站免费 | 日本精品一二三区| 国产精品高潮在线| 国产日韩欧美精品一区二区 | 国产无遮挡又黄又爽又色视频| 性生交大片免费看潘金莲| 精品久久久久99| 日韩av在线网址| 国产日韩欧美综合在线| 91热国产| 国产91综合一区在线观看| 欧美色图视频一区| 国产在线视频二区| 欧美乱战大交xxxxx| 欧美性二区| 乱淫免费视频| 国产在线观看二区| 国产二区不卡| 大bbw大bbw巨大bbb| 久久夜靖品2区| 国产精品美女久久久免费| 亚洲精品www久久久| 国产精品一区二区在线看| 国产欧美久久一区二区三区| 99久久婷婷国产精品综合| 搡少妇在线视频中文字幕| 一区二区久久久久| 精品欧美一区二区在线观看| 天堂av一区二区| 黄色av中文字幕| 欧美国产亚洲精品| 日韩女女同一区二区三区| 久久99亚洲精品久久99果| 欧美精品日韩精品| 久久久人成影片免费观看| 亚洲三区二区一区| 中文字幕在线播放一区| 亚洲欧美日韩精品suv| 在线视频不卡一区| 挺进警察美妇后菊| 国产高清在线一区| 国产欧美日韩综合精品一| 午夜影院你懂的| 特高潮videossexhd| 制服丝袜亚洲一区| 欧美系列一区二区| 欧美日韩国产一区在线| 久久国产精品视频一区| 国产精品中文字幕一区二区三区 | 国产一区二区伦理片| 国产二区精品视频| 日韩欧美精品一区二区三区经典| 亚洲精品国产主播一区| 国产精品视频一区二区在线观看| 欧美髙清性xxxxhdvid| 亚洲欧美日本一区二区三区| 国产一级在线免费观看| 一区二区久久精品66国产精品| 久久精品国产色蜜蜜麻豆| 欧美日韩一卡二卡| 狠狠躁夜夜躁2020| 国产欧美一区二区三区沐欲| 久久一区二区精品| 欧美一区二区三区四区夜夜大片| 国产99网站| 精品999久久久| 亚日韩精品| 少妇精品久久久久www蜜月| 午夜理伦影院| 久久久久国产精品www| 国产精品天堂网| 国产一区二区在线观看免费| 日韩电影在线一区二区三区| 亚洲午夜国产一区99re久久|