日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于搜索的無詞邊界標記語言的分詞方法以及裝置無效

專利信息
申請號: 200710086030.9 申請日: 2007-03-07
公開(公告)號: CN101261623A 公開(公告)日: 2008-09-10
發明(設計)人: 王欣靖;秦勇;劉文 申請(專利權)人: 國際商業機器公司
主分類號: G06F17/27 分類號: G06F17/27;G06F17/30
代理公司: 北京市金杜律師事務所 代理人: 馮譜
地址: 美國紐*** 國省代碼: 美國;US
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 搜索 邊界 標記 語言 分詞 方法 以及 裝置
【說明書】:

技術領域

發明涉及無詞邊界標記語言的分詞技術,更具體地,本發明涉及基于搜索的無詞邊界標記語言文本的分詞方法和裝置。

背景技術

與英文以及其它的西方語言不同,許多亞洲語言,例如中文、日文、韓語以及泰語等語言沒有用空格等詞邊界標記來劃界。一個句子中會包括一串連續的字符,而在單詞之間并沒有定界符,也就是分隔符。如何界定單詞則依賴于所討論的是否為音位單詞、詞匯單詞、語形學單詞、依據造句法的單詞、語義學單詞或是心理學單詞。因此,在任何的基于單詞的語言處理中,例如在文本轉語音也即語音合成(TTS)、文檔特征提取、文檔自動摘要、文檔自動分類和中文文本檢索中,將每一個句子分詞成單詞是首要的步驟。

為了清除起見,本發明例如針對中文進行描述,但是應當理解的是,本發明的范圍并不受限于此。

中文單詞分詞技術主要需要解決中文自然語言處理(NLP)中的兩個問題,即中文中的單詞是什么以及計算機如何自動識別中文單詞。相應地,中文單詞的分詞主要涉及了兩個研究問題,單詞清晰地分界以及未知單詞的識別。而在目前大部分的系統中,這兩個問題被認為是獨立的任務因此采用了層級或是連續的方式通過不同的元件或是組件來完成。然而,由于中文單詞的一些特殊語言特性,使得中文單詞分詞主要的困難在于分詞的結果根據不同的單詞語言學定義以及不同的工程需求而有所變化。關于這一點,并沒有單一的標準使得所有的語言學家和計算機應用都滿意,也沒有能夠統一接受的標準來清晰地確定每一種語境下的單詞。例如,中文語言特別小組(SIGHAN)2005競賽(SIGHAN?Workshop?2005.www.sighan.org/bakeoff2005/)中,雖然所有的組所報告的精確度達到了百分之九十,但是訓練語料庫包含了約90,000句而測試數據集只包含了約4,400句。此外,該結果需要基于四種分詞方法(即AS,PKU,CityU和MSRA)進行單獨的比較。這為期望用于訓練多種類型NLP系統的注標語料庫的發展制造了問題,同時也對期望能夠支持多重用戶應用的中文單詞分詞系統帶來了挑戰。

目前中文單詞分詞的方法基本上可以歸類為四種:1)基于字典的方法;2)統計機器學習方法;3)基于轉換的方法;4)合并方法。

在基于字典的分詞方法中,使用了預先定義的字典以及人工產生的語法規則。在這種方法中根據字典對句子進行分詞,同時應用語法規則來進行改進?;谧值涞姆衷~方法的一種典型的技術稱為最大匹配法,該方法對所輸入的句子和字典中的條目進行比較以找出能夠匹配最多字符的條目??梢钥闯?,基于字典的分詞方法的局限性在于這種方法受限于字典的覆蓋面并且其規則缺乏穩健的統計推論。由于預先定義的字典無法列出所有的單詞也無法及時更新,因此這種方法的準確性在新單詞出現的時候會急劇降低。

統計機器學習方法是一種使用了概率或基于成本的評分機制而不是字典來對文本進行分詞的方法。目前所提出的統計機器學習方法主要有以下幾種:1)MSRSeg方法,該方法包括兩個部分,一個部分是基于線性混合模型結構的一般分詞器,該分詞器對單詞級的中文語言處理的五個特征進行統一,該五個特征為詞典單詞處理、語形學分析、數字串檢測、命名實體識別以及新單詞識別;另一個部分是一組輸出適配器,將一般分詞器的輸出適配為不同的特殊應用標準;2)使用相鄰字符的信息以接合N-gram和其相鄰字符;3)最大似然法;4)應用神經網絡的方法;5)引入中文詞匯分析器的統一基于HHMM(Hierarchical?Hidden?Markov?Model,結構化的隱馬爾可夫模型)的框架;6)從一句話中提取各種可用的特征以構建廣義的模型,并且接著基于這種模型得到各種概率模型;7)使用共有信息以及字符之間的t-評分差,這些共有信息以及字符之間的t-評分是自動從原始中文語料庫中獲得的;將有條件的隨機字段用于分詞任務。由于統計機器學習方法一般基于字符序列共現的信息來進行分析,因此這一類的方法一般要求大量的中文標注語料庫用于模型訓練,而更重要的是其缺乏靈活性以適應于不同的分詞標準。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200710086030.9/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 综合久久色| 国产乱老一区视频| 国产不卡三区| 一区二区三区日韩精品| 88国产精品视频一区二区三区| 国产精品电影免费观看| 国产色99| 91高清一区| 午夜av网址| 久久99精| 欧美福利三区| 国产在线精品一区二区在线播放| 亚洲精品国产主播一区| 国产免费一区二区三区四区| 国产亚洲欧美日韩电影网| 欧美福利三区| 中文字幕在线一二三区| 在线播放国产一区| 久久久人成影片免费观看| xxxx国产一二三区xxxx| 国产99久久久精品视频| 91国偷自产中文字幕婷婷| 国产精品人人爽人人做av片| 亚洲欧美一区二区三区1000| 99久久夜色精品| 免费的午夜毛片| 亚洲乱强伦| 国产亚洲精品久久网站| 亚洲精品少妇一区二区 | 国产极品美女高潮无套久久久| 正在播放国产一区二区| 久久久久国产一区二区三区不卡| 久久久99精品国产一区二区三区| 欧美激情视频一区二区三区| 日韩精品一区在线观看| 91久久国语露脸精品国产高跟 | 欧美日韩一卡二卡| 午夜片在线| 欧美精品国产一区二区| 91精品国产综合久久福利软件| _97夜夜澡人人爽人人| 欧美激情在线观看一区| 午夜影院伦理片| 久久久精品免费看| 国产在线一二区| 精品国产一级| 国产精品v亚洲精品v日韩精品| 久久九精品| 日本xxxxxxxxx68护士| 97国产婷婷综合在线视频,| 久久久精品观看| 国产69精品久久久久男男系列| 国产精品视频免费一区二区| 狠狠色狠狠色综合日日2019| 日本xxxxxxxxx68护士| 国产jizz18女人高潮| 久久三级精品| 999亚洲国产精| 国产无套精品一区二区| 美女啪啪网站又黄又免费| 亚洲精品国产一区| 97人人模人人爽人人喊小说 | 93久久精品日日躁夜夜躁欧美| 国产精自产拍久久久久久蜜 | 午夜爱爱电影| 国内自拍偷拍一区| 销魂美女一区二区| 精品视频在线一区二区三区| 亚洲欧洲一二三区| 午夜爽爽爽男女免费观看| sb少妇高潮二区久久久久| 亚洲无人区码一码二码三码| 国产精品一品二区三区四区五区| 国产97久久| 久久国产欧美日韩精品| 老太脱裤子让老头玩xxxxx | 另类视频一区二区| 国产精品免费一区二区区| 91麻豆精品国产自产欧美一级在线观看| 黄毛片在线观看| 日本一二三区视频在线| 国产99久久九九精品| 亚洲精品国产精品国自| 国产亚洲精品久久久久久网站| 国产日韩欧美精品| 色妞妞www精品视频| 99爱国产精品| 国产精品国产三级国产aⅴ下载| 午夜精品99| 国产中文字幕一区二区三区| 国产一区二区三区精品在线| 91精品一区二区在线观看| 香港三日三级少妇三级99| 亚洲精品国产一区| 综合在线一区| 亚洲国产精品第一区二区| 狠狠色噜噜狠狠狠狠黑人 | 国产伦精品一区二区三区免| 国产视频二区| 国产性生交xxxxx免费| 亚洲欧美日韩综合在线| 精品国产免费久久| xxxx在线视频| 人人要人人澡人人爽人人dvd| 狠狠色狠狠色综合婷婷tag| 狠狠色噜噜综合社区| 精品国产免费一区二区三区| 日韩精品中文字| 国产精品无码专区在线观看| 精品久久一区| 国产精品天堂| 中文无码热在线视频| 综合色婷婷一区二区亚洲欧美国产| 日本福利一区二区| 亚洲精品性| 国产91精品一区| 亚洲一二区在线观看| 国产欧美日韩精品在线| 国产日韩一区二区在线| 欧美大成色www永久网站婷| 91精品丝袜国产高跟在线| 国内久久久久久| 高清欧美xxxx| 日韩av在线资源| 夜夜爽av福利精品导航| 国产精品国产三级国产播12软件| 国产精品一区二区不卡| 日韩av在线一区| 国产一区日韩在线| 欧美国产三区| 国产免费区| 精品国产九九| 久久国产精久久精产国| 97香蕉久久国产超碰青草软件| 中文乱幕日产无线码1区| 欧美freesex极品少妇| 亚洲欧美日韩综合在线| 亚洲国产精品一区在线| 欧美在线视频一二三区| 日韩欧美高清一区| 一区二区三区欧美精品| 日本精品一二三区| 一区不卡av| 久久精品一| 欧美资源一区| 日本高清二区| 一区不卡av| 99国产精品99久久久久久粉嫩| 99精品视频一区| 狠狠躁夜夜av| 精品国产一区二区三区忘忧草| 国产乱一乱二乱三| 中文乱幕日产无线码1区| 国产伦理一区| 久久精品国产精品亚洲红杏| 99爱精品视频| 狠狠色综合久久婷婷色天使| 久久国产精品久久| 国产精品久久免费视频在线| 午夜影院一区| 国产一区二三| 日本一区二区在线电影| 久久99久国产精品黄毛片入口| 欧美一区二区久久| 91波多野结衣| 日韩av在线导航| 午夜大片男女免费观看爽爽爽尤物| 国产精品一区二区在线观看| 欧美一区二区三区四区夜夜大片| 国产免费一区二区三区网站免费| sb少妇高潮二区久久久久| 国产一级二级在线| www色视频岛国| 国产精品19乱码一区二区三区| 精品久久综合1区2区3区激情| 欧美一区免费| 玖玖国产精品视频| 久久精品视频偷拍| 国产精品久久久久久久久久软件| 国产免费第一区| 精品特级毛片| 亚洲国产精品精品| 亚洲欧美一区二区精品久久久| 国产乱人伦偷精品视频免下载| 亚洲二区在线播放视频| 久久久精品中文| 99精品久久99久久久久| 国产日韩欧美综合在线| 欧美3级在线| 午夜激情电影在线播放| 欧美日韩国产在线一区| 狠狠色丁香久久婷婷综合_中| 亚洲精品乱码久久久久久高潮| 国产精品入口麻豆九色| 国产精品乱码久久久久久久久| 国产91精品一区二区麻豆亚洲| 国产精品美女一区二区视频| 国产精品香蕉在线的人| 国产精品高潮呻吟三区四区| 欧美精品日韩| 午夜影院一区| 欧美乱妇高清无乱码| 色噜噜狠狠狠狠色综合久 | 91精品中综合久久久婷婷| 国产精品久久久久久久久久久久久久不卡| 国产精品天堂| 国产精品一区二区免费视频| 国产一区二区电影| 午夜肉伦伦| 一区二区三区国产精华| 免费午夜在线视频| 思思久久96热在精品国产| 欧美三级午夜理伦三级老人| 国产精品麻豆99久久久久久| 国产1区2| 国产精品高潮呻| 亚洲精品456| 性生交大片免费看潘金莲| 性欧美精品动漫| 久久一级精品| 国产精品伦一区二区三区级视频频 | 午夜理伦影院| 91波多野结衣| 久久99亚洲精品久久99果| 少妇高潮一区二区三区99小说| 国产91久久久久久久免费| 日韩av一二三四区| 久久精品视频中文字幕| 国产69精品久久久久孕妇不能看| 国产精品麻豆自拍| 午夜影院h| 伊人久久婷婷色综合98网| 国产欧美综合一区| 97精品国产97久久久久久| 久久久精品免费看| 综合国产一区| 91精品国产一区二区三区| 色噜噜狠狠色综合影视| _97夜夜澡人人爽人人| 91久久久爱一区二区三区| 欧美日韩九区| 国产高清精品一区二区| 国产精品一区在线观看你懂的 | 少妇特黄v一区二区三区图片| 国产免费第一区| 精品一区二区三区影院|