日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種基于語境進行分詞的方法和裝置在審

專利信息
申請號: 201410302925.1 申請日: 2014-06-27
公開(公告)號: CN104077275A 公開(公告)日: 2014-10-01
發明(設計)人: 項碧波 申請(專利權)人: 北京奇虎科技有限公司;奇智軟件(北京)有限公司
主分類號: G06F17/27 分類號: G06F17/27;G06F17/30
代理公司: 北京潤澤恒知識產權代理有限公司 11319 代理人: 趙娟
地址: 100088 北京市西城區新*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 基于 語境 進行 分詞 方法 裝置
【說明書】:

技術領域

發明涉及分詞技術領域,特別是涉及一種基于語境進行分詞的方法和一種基于語境進行分詞的裝置。

背景技術

隨著互聯網的高速發展,網絡應用趨向多元化,網上的信息量急劇增加。

在各種場合下,用戶經常需要輸入關鍵信息進行關聯信息的獲取。例如,在搜索引擎中輸入關鍵詞搜索網頁信息、在論壇中輸入關鍵詞搜索帖子等等。

分詞是進行信息處理、信息檢索的基礎,所有的信息處理、信息檢索工作都是在分詞之后進行的。所以分詞的錯誤會被疊加到后續的處理過程中,而且很難被消除。正因為這樣所以對分詞的準確率的追求是個持續的過程,同時由于中文語言的固有的特性:沒有明確的詞的定義、詞和詞之間沒有分隔符、新詞、專有名詞不斷涌現等這些因素導致分詞很難做到100%的準確。

當前分詞系統使用的主要方法是基于統計的分詞。從形式上看,詞是穩定的字的組合,因此在上下文中,相鄰的字同時出現的次數越多,就越有可能構成一個詞。因此字與字相鄰共現的頻率或概率能夠較好的反映成詞的可信度。可以對語料中相鄰共現的各個字的組合的頻度進行統計,計算它們的互現信息。定義兩個字的互現信息,計算兩個漢字X、Y的相鄰共現概率。互現信息體現了漢字之間結合關系的緊密程度。當緊密程度高于某一個閾值時,便可認為此字組可能構成了一個詞。這種方法只需對語料中的字組頻度進行統計,但這種方法也有一定的局限性,會經常抽出一些共現頻度高、但并不是詞的常用字組,例如“這一”、“之一”、“有的”、“我的”、“許多的”等,并且對常用詞的識別精度差,時空開銷大。

分詞的結果錯誤致使后期獲取的關聯信息與當初的預期有很大差別,用戶體驗十分差,浪費了設備系統資源。

發明內容

鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的一種基于語境進行分詞的方法和相應的一種基于語境進行分詞的裝置。

依據本發明的一個方面,提供了一種基于語境進行分詞的方法,包括:

提取搜索資源中網頁的文本信息;

采用分詞詞典中的特征詞條對所述文本信息進行分詞處理,獲得一個或多個候選分詞;

當所述分詞處理出現歧義時,統計所述候選分詞在所述網頁中表征語境的詞頻數;

依據所述詞頻數調整所述分詞詞典中特征詞條的權重;

依據調整權重后的分詞詞典中的特征詞條對所述文本信息進行分詞處理,確定目標候選分詞。

可選地,所述候選分詞包括第一候選分詞和第二候選分詞中的至少一個;

所述采用分詞詞典中的特征詞條對所述文本信息進行分詞處理,獲得一個或多個候選分詞的步驟包括:

按照第一分詞規則對所述文本信息進行與所述特征詞條進行匹配;

當所述文本信息進行與所述特征詞條進行匹配時,提取所述特征詞條作為第一候選分詞;

按照第二分詞規則對所述文本信息進行與所述特征詞條進行匹配;

當所述文本信息進行與所述特征詞條進行匹配時,提取所述特征詞條作為第二候選分詞;

其中,所述第一分詞規則為與所述第二分詞規則不同的分詞規則。

可選地,所述表征語境的詞頻數包括所述第一候選分詞在所述網頁的文本語言環境中的第一詞頻數,所述第二候選分詞在所述網頁的文本語言環境中的第二詞頻數;

所述當所述分詞處理出現歧義時,統計所述候選分詞在所述網頁中表征語境的詞頻數的步驟包括:

當對同一個文本信息進行分詞處理所獲得的所述第一候選分詞和所述第二候選分詞不同時,判斷所述分詞處理出現歧義;

分別統計所述第一候選分詞在所述網頁中的文本語言環境中的第一詞頻數,以及,所述第二候選分詞在所述網頁中的文本語言環境中的第二詞頻數。

可選地,所述依據所述詞頻數調整所述分詞詞典中特征詞條的權重的步驟包括:

當所述第一詞頻數大于所述第二詞頻數時,提高所述第一候選分詞對應的特征詞條在所述分詞詞典中的權重;

當所述第二詞頻數大于所述第一詞頻數時,提高所述第二候選分詞對應的特征詞條在所述分詞詞典中的權重。

可選地,所述依據調整權重后的分詞詞典中的特征詞條對所述文本信息進行分詞處理,確定目標候選分詞的步驟包括:

按照指定的分詞規則對所述文本信息與提高權重后的所述特征詞條進行匹配;

當所述文本信息進行與所述特征詞條進行匹配時,提取所述特征詞條作為目標候選分詞。

根據本發明的另一方面,提供了一種基于語境進行分詞的裝置,包括:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410302925.1/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产麻豆一区二区三区在线观看| 国产精品亚州| 午夜精品在线观看| 在线国产一区二区三区| 精品国产二区三区| 久久国产麻豆| 性视频一区二区三区| 欧美精品中文字幕亚洲专区| 91午夜精品一区二区三区| 午夜影院h| 日韩午夜毛片| 538在线一区二区精品国产| 国产精品69久久久| 欧美色图视频一区| 午夜一级免费电影| 欧美日韩一级黄| 欧美国产亚洲精品| 欧美日韩一区电影| 国产一区二区三区影院| 国产精品麻豆自拍| 中文字幕制服丝袜一区二区三区| 午夜影院色| 欧美髙清性xxxxhdvid| 挺进警察美妇后菊| 欧美日韩亚洲三区| 日本少妇高潮xxxxⅹ| 国产精品v欧美精品v日韩| 国产精品久久免费视频| 狠狠色噜噜狠狠狠狠777| 久久久精品免费看| 欧美激情精品久久久久久免费| 国产一区二区播放| 最新av中文字幕| 午夜影院试看五分钟| 欧美日韩国产在线一区| 欧美精品日韩精品| 国产精品综合在线| 国产91视频一区| 久久99亚洲精品久久99果| 国产精品视频免费看人鲁| 91国偷自产一区二区介绍| 亚洲精品中文字幕乱码三区91| aaaaa国产欧美一区二区| 国产色午夜婷婷一区二区三区| 91久久国产视频| 欧美黄色一二三区| 精品国产精品亚洲一本大道| 日韩午夜电影院| 国产午夜亚洲精品午夜鲁丝片 | 亚洲国产精品国自产拍久久| 日韩中文字幕一区二区在线视频 | 日韩亚洲欧美一区二区| 国产综合久久精品| 国产精品一区二区av日韩在线| 欧美午夜精品一区二区三区| 欧美日韩亚洲另类| 午夜黄色一级电影| 狠狠躁夜夜躁2020| 在线国产一区二区三区| 99久久久久久国产精品| 国产精品国产三级国产专区55| 欧美乱妇高清无乱码| 亚洲自拍偷拍中文字幕| 亚洲欧洲日韩在线| 欧美一区二区三区四区夜夜大片 | 激情aⅴ欧美一区二区三区| 久久久999精品视频| 精品久久久影院| 国内久久久| 精品一区二区三区视频?| 大bbw大bbw巨大bbw看看| 制服丝袜亚洲一区| 强制中出し~大桥未久在线播放| 欧洲亚洲国产一区二区三区| 欧美一区二区三区黄| xxxxhd欧美| 国产91热爆ts人妖在线| 国产一区欧美一区| 久久久久久久亚洲国产精品87| 夜夜夜夜夜猛噜噜噜噜噜gg| 国产乱一区二区三区视频| 精品久久久久一区二区| 国产一区二区在| 国产精品视频一二区| 中文字幕日本一区二区| 欧美一级片一区| 亚洲精品一区中文字幕| 国产精品久久国产三级国电话系列| 亚洲乱码av一区二区三区中文在线:| 一区不卡av| 一级黄色片免费网站| 爱看av在线入口| 亚洲精品乱码久久久久久麻豆不卡| 黄色av免费| 色综合久久精品| 欧美网站一区二区三区| 69xx国产| 99视频国产精品| 夜夜夜夜曰天天天天拍国产| 小萝莉av| 97久久精品人人做人人爽| 国产男女乱淫视频高清免费| 日韩精品免费播放| 欧美黄色片一区二区| 国产精品色在线网站| 国产精品一区二区毛茸茸| 亚洲国产aⅴ精品一区二区16| 国产精品三级久久久久久电影| 国产午夜精品一区二区三区视频 | 久久精品欧美一区二区| 亚洲精品日本久久一区二区三区| 欧美亚洲精品suv一区| 99久久精品免费看国产免费粉嫩| 国产69精品久久久久男男系列| ass韩国白嫩pics| 亚洲国产精品一区二区久久hs| 久久精品99国产精品亚洲最刺激| 午夜亚洲国产理论片一二三四| 国产91福利视频| xxxx在线视频| 91亚洲欧美强伦三区麻豆| 影音先锋久久久| 国产精品久久久久久久久久久杏吧| 国产欧美一区二区精品性| 国产精品第56页| 99国产精品99久久久久| 99久久精品免费视频| 精品91av| 午夜黄色网址| 日本道欧美一区二区aaaa| 天干天干天干夜夜爽av| 色综合久久88| 久久久久国产精品一区二区三区| 国产九九影院| 一区二区三区免费高清视频| 国产91高清| 国产69精品久久久久999小说| 国产精品视频二区三区| 国产全肉乱妇杂乱视频在线观看 | 国产91丝袜在线熟| 国产精品美女一区二区视频| 亚洲欧美日本一区二区三区| 91热精品| 99国产精品丝袜久久久久久| 日韩欧美激情| 少妇厨房与子伦免费观看| 国产日韩欧美在线一区| 毛片大全免费观看| 国产无套精品一区二区| 夜夜嗨av一区二区三区中文字幕 | 欧美日韩综合一区二区| 欧美日韩精品中文字幕| 国产视频一区二区视频| 91超碰caoporm国产香蕉| 国产精品一区二区在线看| 日韩av在线电影网| 国产日韩一区在线| 欧美亚洲国产日韩| 国产精品一区二区免费视频| 中文字幕国内精品| 99精品黄色| 久久97国产| 午夜毛片在线| 99国产午夜精品一区二区天美| 制服丝袜二区| 欧美一区二区三区免费播放视频了| 亚洲国产精品第一区二区| 中文字幕理伦片免费看| 99视频国产在线| 综合欧美一区二区三区| 国产一区二区免费在线| 亚洲神马久久| 真实的国产乱xxxx在线91| 99精品视频免费看| 久久不卡一区| 欧美黄色片一区二区| 欧美一区亚洲一区| 国产91刺激对白在线播放| 亚洲欧美一区二| 亚洲精品日日夜夜| 四季av中文字幕一区| 中文字幕一区二区三区乱码视频 | 99久久精品国| av午夜影院| 亚洲天堂国产精品| 狠狠色综合久久婷婷色天使 | 日韩欧美视频一区二区| 久久久久国产精品视频| 6080日韩午夜伦伦午夜伦| 少妇高潮大叫喷水| 在线精品国产一区二区三区| 97精品国产aⅴ7777| 91精品中综合久久久婷婷| 99久久久久久国产精品| 满春阁精品av在线导航| 国产精品乱码一区| 欧美日韩一区视频| 国产精品人人爽人人做av片| 97午夜视频| 丰满岳乱妇在线观看中字| 国产专区一区二区| 久久综合久久自在自线精品自| 国产日韩一区二区在线| 日韩av在线影院| 国产麻豆91欧美一区二区| 91久久国语露脸精品国产高跟| 99精品小视频| 国产999精品视频| 国内少妇偷人精品视频免费| 国产精品自拍在线| 国产精品日韩电影| 国产91在线播放| 精品国产区| 思思久久96热在精品国产| 国产69精品久久久久app下载 | 亚洲精品国产精品国自产网站按摩| 久久99精品国产一区二区三区| 夜夜躁日日躁狠狠久久av| 午夜一区二区视频| 国产一级片一区| 国产一区二区三区的电影| 波多野结衣巨乳女教师| 素人av在线| 国产亚洲精品久久久久动| 视频国产一区二区| 国产偷窥片| 99久久夜色精品国产网站| 精品一区二区三区视频?| 99国产精品99久久久久久粉嫩| 国产精品高清一区| 久久人91精品久久久久久不卡| 日本免费电影一区二区| 性生交大片免费看潘金莲| 免费看欧美中韩毛片影院| 最新国产一区二区| 午夜激情免费电影| 国产日韩欧美不卡| 国产一区二区片| 国产二区不卡| 久久久综合香蕉尹人综合网| 国产精品96久久久| 国产精品久久久久久一区二区三区| 在线精品视频一区| 国产视频二区在线观看| 欧美亚洲视频一区二区| 亚洲欧美另类久久久精品2019|