日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種在網絡上提取近義詞的方法及系統有效

專利信息
申請號: 200710304564.4 申請日: 2007-12-28
公開(公告)號: CN101226532A 公開(公告)日: 2008-07-23
發明(設計)人: 禹榮凌;劉云峰 申請(專利權)人: 騰訊科技(北京)有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京集佳知識產權代理有限公司 代理人: 逯長明
地址: 100089北京市海*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 網絡 提取 近義詞 方法 系統
【說明書】:

技術領域

發明涉及近義詞提取領域,特別是涉及一種在網絡上提取近義詞的方法及系統。

背景技術

在互聯網上利用網絡資源提取近義詞,可以為網頁搜索相關性、自然語言處理、文本挖掘等提供支持。但在網絡上,難以找到恰當的方式去界定近義詞,因此,目前現有技術仍采用對比查找方式。

參閱圖1,為現有在網絡上提取近義詞的方法,具體步驟如下所述。

步驟S101、預置近義詞詞庫。人工通過相關詞典和經驗整理近義詞,將整理好的近義詞組成近義詞庫。近義詞庫包括通常意義上詞義相近的詞語,如“吃飯”、“就餐”,“猶豫”、“躊躇”等,還包括廣義上的近義詞,即表示同一事物的詞語,如“北京”、“北京大學”等。

步驟S102、提取網頁文本,對網頁文本進行分詞處理。在網絡上抓取所需網頁,再在網頁上提取正文文本,對正文文本進行分詞處理,將各詞語使用空格隔開,過濾掉虛詞、語氣詞、介詞等不具有實質意義的詞語。

步驟S103、將網頁文本與近義詞詞庫對比,提取與近義詞詞庫相同的詞語。

步驟S104、根據提取的近義詞對網頁進行分析。

上述方法只是根據已有的近義詞庫在網絡上提取相同的近義詞,進行分析。但近義詞庫是根據人工整理的,一般數據量較小,覆蓋范圍也較小,基于該數據庫提取近義詞,提取的廣度受到很大的局限。

網絡上的近義詞很多由網絡語言習慣形成的,預先設置近義詞庫很難囊括這些網絡特有的近義詞,基于預置的近義詞庫無法查找到這些近義詞,提取近義詞的適用性較低。

發明內容

本發明所要解決的技術問題是提供一種在網絡上提取近義詞的方法及系統,以解決現有技術中近義詞提取的廣度和適用性較低的問題。本發明提取的近義詞具有較高的廣度和精度。

本發明公開一種在網絡上提取近義詞的方法,包括:獲取網頁上各反向鏈接的錨文本;將所述錨文本兩兩對比,分別去除重疊的詞語;將剩余的詞語組成近義詞集合,基于所述近義詞集合提取近義詞。

優選的,獲取網頁各反向鏈接的錨文本之前,還包括:獲取網頁上各反向鏈接父網頁的Rank值,及該父網頁所屬主域的Rank值;如父網頁的Rank值,和/或該網頁所在主域的Rank值低于預設數值,去除該父網頁對應的反向鏈接。

優選的,獲取網頁各反向鏈接的錨文本之后,還包括;計算錨文本權重,去除權重值低于預置數值的錨文本。

優選的,基于所述近義詞集合提取近義詞具體為:獲取上述剩余詞語在所述錨文本中的出現頻次,所述各反向鏈接父網頁的Rank值,及該父網頁所屬主域的Rank值;根據上述數值分別計算上述剩余詞語中各個詞語對的近義概率;選取近義概率超過預設閾值的詞語對作為近義詞。

優選的,基于所述近義詞集合提取近義詞具體為:獲取上述剩余詞語在所述錨文本中的出現頻次,所述各反向鏈接父網頁的Rank值,及該父網頁所在主域的Rank值;根據上述數值分別計算上述剩余詞語中各詞語對的近義概率,重復上述步驟,獲取各詞語對在各個網頁的近義概率;針對每個詞語對,將其在不同網頁的近義概率分別乘以該近義概率對應反向鏈接子頁面的Rank值,獲得的乘積相加,作為該詞語對的總近義概率;提取總近義概率超過設定閾值的詞語對作為近義詞。

優選的,根據上述數值分別計算上述剩余詞語中各詞語對的近義概率具體為:針對每個詞語對,將詞語對中一詞語的出現頻次乘以其對應反向鏈接父網頁的Rank值,乘積取對數后再乘以設定系數;將詞語對中另一詞語的出現頻次乘以其對應反向鏈接父網頁所屬主域的Rank值,乘積取對數;獲得的數據相加,為該詞語的近義概率。

優選的,根據上述數值分別計算上述剩余詞語中各詞語對的近義概率具體為:針對每個詞語對,將詞語對中一詞語的出現頻次乘以其對應反向鏈接父網頁的Rank值,另一詞語的出現頻次乘以其對應反向鏈接父網頁所屬主域的Rank值;獲得的數據相加,為該詞語的近義概率。

本發明還公開一種在網絡上提取近義詞的系統,包括錨文本獲取模塊、對比模塊、去除模塊、及組成模塊:所述錨文本獲取模塊,用于獲取網頁上各反向鏈接的錨文本;所述對比模塊,用于將所述錨文本兩兩對比;所述去除模塊,用于分別去除重疊的詞語;所述組成模塊,用于將剩余的詞語組成近義詞集合。

優選的,還包括數據獲取模塊、近義概率計算模塊、近義詞模塊:所述數據獲取模塊,用于獲取上述剩余詞語在所述錨文本中的出現頻次,所述各反向鏈接父網頁的Rank值,及該父網頁所屬主域的Rank值;所述近義概率計算模塊,用于根據上述數值分別計算上述剩余詞語中各個詞語對的近義概率;所述近義詞模塊,用于選取近義概率超過預設閾值的詞語對作為近義詞。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(北京)有限公司,未經騰訊科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200710304564.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美视屏一区二区| 中文字幕在线播放一区| 91视频国产一区| 欧美hdxxxx| 91麻豆精品一区二区三区| 欧美精品国产一区二区| 国产一区二区手机在线观看| 欧美日韩一区二区三区四区五区| 国产91丝袜在线播放动漫| 久久久久久国产精品免费| 久久国产麻豆| 一区二区三区四区国产| 国产乱了高清露脸对白| xxxxx色| 国产一级一片免费播放| 欧美系列一区二区| 亚洲精品一区在线| 国产高清无套内谢免费| 精品香蕉一区二区三区| 国产精品亚洲一区二区三区| 亚洲精品日韩在线| 欧美一区二区性放荡片| 亚洲精品卡一卡二| 国产女人和拘做受在线视频| 欧美一区二区三区日本| 久久综合二区| 久久99国产综合精品| 精品日韩久久久| 国产一区不卡视频| 国产一区正在播放| 国产不卡一区在线| 91精品一区二区中文字幕| 岛国黄色av| 美日韩一区| 亚洲乱亚洲乱妇28p| 91精品国产综合久久国产大片| 国产中文字幕91| 丰满岳乱妇bd在线观看k8 | 99国产精品一区二区| 国产日韩区| www.久久精品视频| 国产一区二区三区在线电影| 欧美亚洲国产日韩| 欧美午夜精品一区二区三区| 99热一区二区| 国产精品高潮呻吟三区四区| 国产综合久久精品| 日本一区二区三区在线看| 在线播放国产一区| 国产在线不卡一| 日韩精品中文字幕一区二区| 日韩国产精品久久久久久亚洲| 午夜剧场a级免费| 日韩午夜三级| 亚洲自拍偷拍一区二区三区| 国产一区二区片| 国产在线精品二区| 久久天天躁夜夜躁狠狠躁2022| 国产高清在线精品一区二区三区| 97欧美精品| 99久久免费精品国产男女性高好| 亚洲一二区在线观看| 亚洲精品卡一卡二| 国产在线干| 国产日韩欧美自拍| 国产一区二区视频播放| 精品国产乱码久久久久久图片| 国产无遮挡又黄又爽又色视频| 女女百合互慰av| 国产一级片自拍| 精品国产乱码久久久久久老虎| 一区二区三区国产精品| 欧美日韩一区二区三区69堂| 精品久久一区| 二区三区免费视频| 久久99精品久久久噜噜最新章节 | 私人影院av| 国产亚洲精品久久久久久久久动漫 | 狠狠色狠狠综合久久| 日韩精品中文字幕一区二区| 日韩电影在线一区二区三区| 亚洲欧美另类国产| 欧美xxxxhdvideos| 国产麻豆一区二区| 一区二区三区欧美日韩| 99国产精品久久久久99打野战 | 日本一级中文字幕久久久久久| 欧洲在线一区二区| 91国产在线看| 久久精品麻豆| 国产97免费视频| 伊人欧美一区| 亚洲国产精品一区在线| 久久不卡精品| 国产精品无码永久免费888| 夜夜躁狠狠躁日日躁2024| 精品国产乱码久久久久久久久| 97久久精品人人做人人爽| 2023国产精品自产拍在线观看| 99国产精品欧美久久久久的广告| 久久夜色精品国产噜噜麻豆| 91看片淫黄大片91| 日本护士hd高潮护士| 特高潮videossexhd| 黄色av免费| 91黄在线看| 99久国产| 日韩av在线中文| 97香蕉久久国产超碰青草软件| 国产中文字幕91| 午夜情所理论片| 亚洲精品一区二区另类图片| 麻豆91在线| 中文字幕一区二区在线播放| 久久国产中文字幕| 欧美一区二区三区久久精品| 91看片片| 精品国产乱码久久久久久图片| 精品国产区一区二| 国产天堂一区二区三区| 国产精品视频久久久久久| 欧美一区久久| 国产精品二区一区| 在线观看欧美一区二区三区| 51区亚洲精品一区二区三区| 久99久精品| 影音先锋久久久| 久久综合伊人77777麻豆最新章节 一区二区久久精品66国产精品 | 99国产精品久久久久| 欧美午夜羞羞羞免费视频app| av午夜电影| 日韩午夜三级| 欧美日韩一级二级| 国产在线一区观看| 国产日韩欧美亚洲| 欧美日韩中文国产一区发布| 国偷自产中文字幕亚洲手机在线| 午夜大片男女免费观看爽爽爽尤物| 激情欧美一区二区三区| www.久久精品视频| 午夜影院激情| 国产精品9区| 91福利视频免费观看| 日韩中文字幕亚洲精品欧美| 国产精品一二二区| 久久婷婷国产综合一区二区| 国产1区2区视频| 精品91av| 日本一区二区免费电影| 日韩欧美高清一区| 国产97久久| 狠狠色狠狠色88综合日日91| 久久婷婷国产综合一区二区| 日韩一区免费| 午夜大片网| 中文字幕在线乱码不卡二区区| 国产欧美亚洲精品| 国产另类一区| 国产韩国精品一区二区三区| 国产日韩欧美亚洲| 久久精品国产亚洲7777| 国产欧美日韩精品在线| 国产精品自产拍在线观看蜜| 国产一级不卡视频| 国产一二区视频| 亚洲午夜天堂吃瓜在线| 国产一区午夜| 亚洲第一区国产精品| 亚洲一二三在线| 色噜噜狠狠狠狠色综合久 | 国产一区免费播放| 免费久久99精品国产婷婷六月| 亚洲欧美一区二区三区不卡| 欧美精品一区二区三区四区在线| 欧美精品国产一区| 日本午夜影视| 国产欧美精品一区二区在线播放| 国产一区二区三区四| 97久久久久亚洲| 国内精品99| 久久久一二区| 中文字幕一二三四五区| 国产精品一区二区av麻豆| 亚洲欧美国产中文字幕| 少妇高清精品毛片在线视频| 亚洲日本国产精品| 日韩亚洲国产精品| 久久99精| 久久99中文字幕| 国产精品一级片在线观看| 欧美日韩国产影院| 国产伦精品一区二区三区四区| 鲁丝一区二区三区免费观看| 在线国产一区二区| 国产精品亚洲精品一区二区三区| 国产精品一二三区视频出来一| 国产日韩欧美亚洲| 欧美三区视频| 久久久国产精品一区| 久久99精品国产麻豆婷婷洗澡| 激情久久久| 国产1区2区3区中文字幕| 欧美激情综合在线| 国产精自产拍久久久久久蜜| 欧美日韩一区二区三区免费| 26uuu色噜噜精品一区二区| 国产一区二区二| 最新国产精品自拍| 色噜噜狠狠色综合影视| 国产91福利视频| 真实的国产乱xxxx在线91| 国产一区www| 国产精品久久久不卡| 国产无遮挡又黄又爽又色视频 | 日本亚洲国产精品| 日本午夜一区二区| 国产精品18久久久久白浆| 欧美亚洲国产日韩| 一区二区三区在线影院| 男女视频一区二区三区| 精品国产区一区二| 91福利视频免费观看| 丰满少妇高潮惨叫久久久一| 国产一区二区三区影院| 欧美日韩精品在线播放| 精品视频久| www.久久精品视频| 妖精视频一区二区三区| 色婷婷久久一区二区三区麻豆 | 51区亚洲精品一区二区三区| 88国产精品欧美一区二区三区三| av素人在线| 精品少妇一区二区三区| 欧美一区二区三区免费在线观看| 欧美精品久| 免费毛片**| 电影91久久久| 久久精品爱爱视频| 三上悠亚亚洲精品一区二区| 亚洲精品一区二区另类图片| 国产乱人伦偷精品视频免下载| 久久一二区| 狠狠插影院| 国产午夜精品一区二区理论影院| 国产v亚洲v日韩v欧美v片| 国产一区二区三级|