日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種中文垂直搜索的檢索串拆分方法有效

專利信息
申請號: 201310538096.2 申請日: 2013-11-04
公開(公告)號: CN103544309A 公開(公告)日: 2014-01-29
發明(設計)人: 趙毅強;楊紅塵 申請(專利權)人: 北京中搜網絡技術股份有限公司
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 北京安博達知識產權代理有限公司 11271 代理人: 徐國文
地址: 100191 北京市海淀*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 中文 垂直 搜索 檢索 拆分 方法
【說明書】:

技術領域

發明涉及一種計算機領域的方法和裝置,具體講涉及一種中文垂直搜索的檢錯串拆分方法。

背景技術

隨著網絡信息的爆炸式增長,垂直搜索引擎的數據來源和數據規模也在高速增長,為提高搜索的查準率,使用戶獲得更好的搜索體驗,關鍵在于理解用戶的查詢需求,按語義將用戶輸入的檢索串拆分為連續的短語。目前,檢索串拆分主要針對網頁搜索,拆分方法主要有兩類:基于實體詞典的方法和基于統計機器學習的方法,基于統計機器學習的方法又可分為有監督的學習方法和無監督的學習方法。

基于實體詞典的方法:由人工或半人工的方式收集實體名稱詞典,在其中查找分詞后的檢索串的子串,以前向最大匹配、后向最大匹配、最短切分路徑等啟發式策略獲得最終的切分結果。

有監督的學習方法:先人工搜集并切分一定數目的檢索串,以之作為語料庫,然后使用機器學習方法從語料中學習出相應的切分模型,再利用學習到的模型對新輸入的檢索串進行切分。

無監督的學習方法:以未切分的數據(檢索串或網頁數據)作為訓練語料,使用機器學習方法從中學習到隱含的模型(如短語的概率分布),并利用這些模型識別新輸入的檢索串中的短語,完成檢索串的切分。

基于實體詞典的方法在檢索串的切分過程中采用直接查找詞典條目的方式識別短語,不使用任何上下文信息,因此對歧義的處理能力比較差。同時為保證詞典的質量,詞典的構建和更新往往采用人工或半人工方式,導致詞典更新速度較慢,影響切分效果。

有監督的學習方法需要足夠規模的人工標注數據,由于不同領域的語言規律上的差異,針對不同的垂直搜索,通常需要構建不同的人工標注數據集合,這導致了人力成本方面的巨大開銷。

無監督的學習方法采用原始的未切分的數據作為訓練集合,因此所形成的短語結構的模型容易引入噪聲,加大了短語邊界判定上的誤差,導致切分準確率的下降。

發明內容

為了克服上述現有技術的不足,本發明提供一種針對中文垂直搜索的檢索串拆分方法,該方法基于詞典和用戶檢索語言模型的混合方法來識別中文垂直搜索檢索串中的短語,克服了詞典方法在處理歧義上的困難,避免了監督學習方法在人工語料標注上的開銷,降低了噪聲對無監督學習方法切分邊界的影響。

實現上述目的所采用的解決方案為:

一種中文垂直搜索的檢索串拆分方法,其改進之處在于:所述方法通過實體詞典和無監督學習方法拆分中文垂直搜索的檢索串,包括以下步驟:I、建立實體詞典和語言模型;

II、檢索串進行實體名稱匹配;

III、處理檢索串中非中文字符;

IV、檢索串分詞;

V、建立候選短語的權值矩陣;

VI、獲得檢索串所有候選短語的組合的權值;

VII、將權值最大的短語組合作為檢索串的拆分結果返回。

進一步的,所述步驟I中實體詞典通過人工或半人工方式構建和更新;所述語言模型使用無監督的學習方法根據用戶查詢日志構建。

進一步的,所述步驟II包括:用戶輸入所述檢索串;實體詞典查找所述檢索串;若所述檢索串為實體名稱條目,則將所述檢索串作為短語直接返回;否則進入所述步驟III。

進一步的,所述步驟III中遍歷所述檢索串的詞,處理獲得的非中文字符;所述處理包括:將非中文字符中的ASCII字符聚集為單詞;將寬字符字母和數字轉換為ASCII字符;將長數字串進行折疊;識別漢語拼音。

進一步的,所述步驟IV的檢索串的分詞和學習語言模型使用的分詞工具為同一個分詞工具,以防止學習到的語言模型無法為切分提供正確的支持

進一步的,所述步驟V包括:步驟1、將所述檢索串分詞,所有詞從左至右依次編號;

步驟2、將所述檢索串分為以詞為單位的子串,對所述子串分別賦予數值,所述數值用于衡量該子串成為短語的可能性;

步驟3、將所述數值的結構存放候選短語權值矩陣;所述矩陣為上三角陣,元素的行下標和列下標分別表示該候選短語的起始詞和結束詞的序號;

步驟4、所述檢索串被切分為n個詞,所述語言模型的最大階數為m,所述實體詞典為D,則候選短語權值矩陣W為n×n上三角陣,候選短語權值矩陣W的計算如下式1:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中搜網絡技術股份有限公司,未經北京中搜網絡技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310538096.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91久久免费| 国产91清纯白嫩初高中在线观看| 日韩欧美高清一区| 国产精品视频免费一区二区| 97人人澡人人添人人爽超碰| 一级午夜电影| 麻豆精品久久久| 国产91精品高清一区二区三区| 68精品国产免费久久久久久婷婷| 中文字幕制服丝袜一区二区三区| 国产欧美亚洲精品第一区软件| 久久久午夜爽爽一区二区三区三州| 91精品国产综合久久国产大片| 91人人精品| 国产日韩精品一区二区三区| 亚洲精品久久久久www| 亚洲国产日韩综合久久精品| 亚洲精品国产精品国自产网站按摩| 国产jizz18女人高潮| 国产在线一区不卡| 国产精品二十区| 高清国产一区二区三区| 中文字幕亚洲欧美日韩在线不卡| 久久综合国产精品| 亚洲精品www久久久久久广东 | 亚洲国产99| 欧美一区二区三区四区在线观看| 91福利试看| 国产欧美一区二区在线观看| 午夜肉伦伦| 波多野结衣女教师电影| 91久久国产视频| 狠狠色综合久久丁香婷婷| 精品国产乱码久久久久久久 | 久免费看少妇高潮a级特黄按摩| 精品国产仑片一区二区三区| 亚洲精品国产一区| 国产在线视频99| 亚洲女人av久久天堂| 夜色av网站| 岛国精品一区二区| 久久久久亚洲国产精品| 中文字幕欧美久久日高清| 亚洲精品一区二区三区香蕉| 97久久精品人人做人人爽| 国产1区2| 国产精品一区二区中文字幕| 午夜激情免费电影| 小萝莉av| 欧洲激情一区二区| 久久国产精品免费视频| 少妇**毛片| 三上悠亚亚洲精品一区二区| 亚洲国产精品一区二区久久hs| 国产麻豆91欧美一区二区| 午夜影院黄色片| 国产亚洲精品久久久久久网站| 日韩精品中文字幕久久臀| 国产一区在线视频播放| 亚州精品中文| 国产伦精品一区二区三区免费下载| 91精品视频一区二区| 精品三级一区二区| 久久乐国产精品| 国产欧美精品一区二区三区-老狼| 国产精品国产三级国产专区52 | 日韩毛片一区| 99久久免费毛片基地| 久久综合伊人77777麻豆最新章节| 91精品久久久久久综合五月天| 久久久一二区| 欧美精品久久一区二区| 欧美一级久久久| 国产69精品久久久久久久久久| 97精品久久久午夜一区二区三区| 午夜欧美影院| 性生交片免费看片| 97人人模人人爽视频一区二区| 亲子乱子伦xxxx| 国产无套精品久久久久久| 99久久99精品| 最新国产精品久久精品| 国产午夜精品理论片| 久久99亚洲精品久久99果| 999久久国精品免费观看网站| 欧美日韩一区在线视频| 在线精品国产一区二区三区88| 99久久久久久国产精品| 欧美日本一二三区| 中文字幕二区在线观看| 国产精品久久久久久久综合| 欧美精品一卡二卡| 91亚洲欧美日韩精品久久奇米色| 亚洲五码在线| 三级视频一区| 亚洲四区在线观看| 国产日韩欧美综合在线| 久久久久久国产精品免费| 91精品国产综合久久婷婷香| 高清国产一区二区| 日本五十熟hd丰满| 日本精品一区二区三区在线观看视频| 高清人人天天夜夜曰狠狠狠狠| 91久久国语露脸精品国产高跟| 国产精品一区亚洲二区日本三区| 久久99精品国产麻豆婷婷| 自偷自拍亚洲| 国内少妇自拍视频一区| 欧美乱码精品一区二区三| 国产一区www| 特级免费黄色片| 国产精品6699| 国产另类一区| 亚洲高清乱码午夜电影网| 日本一区二区三区免费播放| 精品国产一区二区三区久久久久久| 久久国产精品-国产精品| 国产一级片子| 欧美日韩一级在线观看| 国产精品一二三区视频出来一| 91精品国产高清一区二区三区| 中出乱码av亚洲精品久久天堂| 国产在线一二区| 在线观看v国产乱人精品一区二区| 久久乐国产精品| 欧美精品国产一区二区| 欧美777精品久久久久网 | 男女午夜影院| 亚洲一区二区国产精品| 一区二区精品在线| 日韩av在线免费电影| 91精品久| 国产精品一级在线| 久久久久亚洲精品视频| 91日韩一区二区三区| 国产日韩欧美精品一区二区| 亚洲精品乱码久久久久久写真| 456亚洲精品| 国产精品入口麻豆九色| 93久久精品日日躁夜夜躁欧美| 久久精品视频3| 欧美二区在线视频| 国内精品国产三级国产99| 日韩av一区不卡| 亚洲精品久久久久999中文字幕| 国产精品中文字幕一区二区三区 | 欧美高清视频一区二区三区| 国产精品久久免费视频| 黄色91在线观看| 欧美高清视频一区二区三区| ass美女的沟沟pics| 国产日韩欧美在线影视| 国产清纯白嫩初高生在线播放性色| 国产激情二区| 午夜色影院| 国产有码aaaae毛片视频| 91婷婷精品国产综合久久| 99国产精品久久久久99打野战 | 国精产品一二四区在线看| 国产区精品区| 日本久久不卡| 人人玩人人添人人澡97| 国产一二三区免费| 国产精品99一区二区三区| 91黄在线看| 日韩精品一区在线观看| 国产欧美日韩二区| 欧美日韩卡一卡二| 91精品国产高清一二三四区| 午夜免费片| 国产黄一区二区毛片免下载| 日韩av在线播| 国产乱码一区二区| 欧美一区二三区| 午夜欧美影院| 久久国产欧美一区二区三区精品| 一区二区三区欧美视频| 久久精品中文字幕一区| 国产精品乱码久久久久久久久| 亚洲欧美一区二区三区1000| 一区二区欧美视频| 国产88在线观看入口| 午夜影院91| 日韩偷拍精品| 久久激情影院| 视频一区欧美| 亚洲精品国产91| ass韩国白嫩pics| 97久久精品人人澡人人爽| 毛片免费看看| 97视频精品一二区ai换脸| 亚洲精品老司机| 精品一区二区在线视频| 欧美精选一区二区三区| 国产69久久| 在线国产精品一区二区| 老太脱裤子让老头玩xxxxx| 中文字幕日本精品一区二区三区| 国产精品视频1区| 久久久久偷看国产亚洲87| 精品99免费视频| 淫片免费看| 国产精品国产三级国产aⅴ下载| 曰韩av在线| 国产1区2区3区| 粉嫩久久99精品久久久久久夜| 国产精品国产亚洲精品看不卡15| 亚洲色欲色欲www| 欧美国产一区二区在线| 国产一区二区高潮| 四虎国产精品永久在线国在线 | www.午夜av| 一区二区免费播放| 精品国产鲁一鲁一区二区三区| 男人的天堂一区二区| 欧美xxxxhdvideos| 亚洲精品久久久久中文字幕欢迎你 | 91精品色| 日韩有码一区二区三区| 久久人91精品久久久久久不卡| 亚洲在线久久| 欧美日韩久久一区二区 | 国产性猛交| 91看片片| 欧美乱妇高清无乱码免费| 欧美一区二区三区激情在线视频| 91精品资源| 亚洲欧美国产日韩综合| 色狠狠色狠狠综合| 国产呻吟久久久久久久92| 最新国产一区二区| 91精品一区二区在线观看| 精品久久小视频| 99久久国产综合| 国产精选一区二区| 爱看av在线入口| 国产性猛交xx乱| 狠狠色噜噜狠狠狠狠视频| 国产在线一区二区视频| 国产精品日韩视频| 性xxxxfreexxxxx交| 伊人精品一区二区三区| 99国精视频一区一区一三| 香港三日本8a三级少妇三级99| 国产在线一区二区视频| 美国一级片免费观看|