日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]用于名稱消岐聚類的裝置和方法有效

專利信息
申請號: 201110056065.4 申請日: 2011-03-03
公開(公告)號: CN102654881A 公開(公告)日: 2012-09-05
發明(設計)人: 王新文;夏迎炬;孟遙;張姝;賈文杰;于浩 申請(專利權)人: 富士通株式會社
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京集佳知識產權代理有限公司 11227 代理人: 杜誠;李春暉
地址: 日本神*** 國省代碼: 日本;JP
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 用于 名稱 消岐聚類 裝置 方法
【說明書】:

技術領域

發明涉及名稱消岐聚類,尤其涉及利用動態閾值進行名稱消岐聚類的裝置和方法。

背景技術

名稱消岐是最近興起的一個研究方向。名稱消岐是針對由于同一名稱(人名、地名、組織機構名等)被現實中的多個實體使用而產生的名稱歧義現象而提出的,目前大多數的名稱消岐方案采用文本聚類的方法。例如,當利用搜索引擎搜索某個名稱時,作為搜索結果返回大量包含該名稱的網頁D={d1,d2,…,dn},這些網頁中的名稱可能指向現實中的不同實體,聚類的目的是按照不同實體將這些網頁構成的文本集合聚合為若干類C={c1,c2,…,cm},其中每個類ci對應于現實中的一個實體,從而達到消岐的目的。

典型的聚類算法不同程度地涉及對閾值的選擇,而閾值的選擇直接影響聚類效果。然而,由于名稱歧義的特殊性,傳統的文本聚類方法在名稱消岐上的聚類效果差強人意,導致這個問題的主要原因在于對于不同的名稱的聚類最優截斷閾值不同而導致聚類結果不理想。例如,針對某個常用人名的文本集合與針對某個生僻人名的文本集合具有不同的相似度特性,相應地,這兩個文本集合在聚類過程中具有最佳聚類效果的相似度閾值也存在差異。因此,如果采用固定的閾值進行聚類,難以針對具有不同相似度特性的文本集合達到理想的聚類效果。

發明內容

本發明的目的在于提供一種利用動態閾值進行名稱消岐聚類的裝置和方法,以至少部分地克服現有技術的上述缺陷。

根據本發明的一個實施例,提供一種對名稱訓練集進行數據處理的裝置,包括:代表相似度確定單元,用于確定名稱訓練集的代表相似度,該代表相似度為該名稱訓練集中的文本間相似度的代表值;優選相似度閾值選擇單元,用于采用不同的相似度閾值對該名稱訓練集進行聚類以選擇使聚類效果較佳的相似度閾值作為優選相似度閾值;以及函數擬合單元,用于根據至少兩個名稱訓練集中的每個名稱訓練集的代表相似度和優選相似度閾值擬合表示代表相似度與優選相似度閾值之間對應關系的函數。

根據本發明的另一個實施例,提供一種對名稱訓練集進行數據處理的方法,包括步驟:確定至少兩個名稱訓練集中每個名稱訓練集的代表相似度,該代表相似度為相應名稱訓練集中的文本間相似度的代表值;針對至少兩個名稱訓練集中的每個名稱訓練集,采用不同的相似度閾值進行聚類以選擇使聚類效果較佳的相似度閾值作為優選相似度閾值;以及根據至少兩個名稱訓練集中每個名稱訓練集的代表相似度和優選相似度閾值,擬合表示代表相似度與優選相似度閾值之間對應關系的函數。

根據本發明的再一個實施例,提供一種用于名稱消岐的聚類裝置,包括:代表相似度確定單元,用于確定待消岐名稱集的代表相似度;優選相似度閾值估算單元,用于根據表示代表相似度與使聚類效果較佳的優選相似度閾值之間對應關系的預定函數,確定與所確定的代表相似度對應的優選相似度閾值;以及聚類單元,用于利用所確定的優選相似度閾值對待消岐名稱集進行聚類。

根據本發明的又一個實施例,提供一種用于名稱消岐的聚類方法,包括步驟:確定待消岐名稱集的代表相似度;根據表示代表相似度與使聚類效果較佳的優選相似度閾值之間對應關系的預定函數,確定與所確定的代表相似度對應的優選相似度閾值;以及利用所確定的優選相似度閾值對待消岐名稱集進行聚類。

根據本發明的實施例,通過對每個名稱集的聚類閾值進行動態調整,能夠減少由于使用固定閾值而造成的聚類效果偏差,可以針對不同的名稱集給出優選的聚類閾值,從而提高聚類的自適應性,并且提高最終聚類效果。

附圖說明

參照下面結合附圖對本發明實施例進行的說明,會更加容易地理解本發明的以上和其它目的、特點和優點。為了避免因不必要的細節而模糊了本發明,在附圖中僅僅示出了與根據本發明的方案密切相關的裝置結構和/或處理步驟,而省略了與本發明關系不大的其它細節。

圖1是示出根據本發明實施例的用于對名稱訓練集進行數據處理的裝置100的配置的框圖;

圖2是示出圖1所示的代表相似度確定單元110的配置的框圖;

圖3是示出根據本發明實施例的對名稱訓練集進行數據處理的方法的流程圖;

圖4是示出圖3所示的確定名稱訓練集的代表相似度的步驟S310中的過程的流程圖;

圖5是示出根據本發明實施例的用于名稱消岐的聚類裝置的配置的框圖;

圖6是示出根據本發明實施例的用于名稱消岐的聚類方法的流程圖;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201110056065.4/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 香蕉av一区二区| 国产的欧美一区二区三区| 91精品www| 99久久精品免费看国产免费粉嫩| 日韩亚洲欧美一区| 妖精视频一区二区三区| 中文字幕欧美一区二区三区 | 精品无人国产偷自产在线| 伊人精品一区二区三区| 玖玖爱国产精品| 日韩欧美多p乱免费视频| 欧美一区二区三区艳史| 99国产精品久久久久| 久久精品色欧美aⅴ一区二区| 欧美中文字幕一区二区| 亚洲国产欧美一区二区丝袜黑人| 国产.高清,露脸,对白| 玖玖国产精品视频| 国产精品美女一区二区视频| 久久久精品a| 国产特级淫片免费看| 夜夜躁日日躁狠狠躁| 中文字幕av一区二区三区四区| 欧美激情精品一区| 97午夜视频| av狠狠干| 视频二区狠狠色视频| 国产69精品久久久久9999不卡免费 | 首页亚洲欧美制服丝腿| 久久精品男人的天堂| 亚洲精品国产主播一区| 久久综合国产精品| 一色桃子av大全在线播放| 午夜影院激情| 亚洲国产精品97久久无色| 欧美福利三区| 亚洲精品乱码久久久久久高潮| 国产欧美一区二区在线 | 国产一区二区三区伦理| 国产一区二区麻豆| 99精品久久99久久久久| 国产一区二区午夜| 亚洲欧美日韩在线| 香港三日本三级三级三级| 国产亚洲精品久久网站| 国产精品视频一区二区在线观看 | 国产aⅴ精品久久久久久| 国产99久久九九精品免费| 国产精品乱码一区| 国产日产精品一区二区三区| 欧美一区二区久久| 欧美一级久久精品| 国产激情视频一区二区| 羞羞免费视频网站| 高清国产一区二区 | 国产精品国产三级国产专区51区 | 欧美日韩综合一区| 在线观看欧美一区二区三区| 国产一区二区电影| 日韩一区二区精品| 国产精品高潮在线| 91麻豆精品国产91久久久资源速度| 一区二区在线国产| 中文乱幕日产无线码1区| 国产69精品久久99不卡免费版| 国产一二区在线| 亚洲国产精品区| 99热久久这里只精品国产www| 欧美片一区二区| 国产精品视频1区| 精品国产鲁一鲁一区二区三区| 国产精品视频1区| 欧美xxxxhdvideos| 99国产精品一区二区| 激情久久久| 伊人av综合网| 狠狠插狠狠爱| 国产伦精品一区二区三| 国产精品电影一区二区三区| 亚洲影院久久| 日本三级韩国三级国产三级| 国产精品v欧美精品v日韩| 精品久久不卡| 久久96国产精品久久99软件| 日韩av一区二区在线播放| 2020国产精品自拍| 99国产精品丝袜久久久久久| 最新国产精品久久精品| 午夜影院h| 久久福利免费视频| 91亚洲精品国偷拍自产| 午夜影院激情| 国产精品久久久久久久久久久久冷| 久久99精品久久久久婷婷暖91| 欧美在线播放一区| 97午夜视频| 男人的天堂一区二区| 99国产精品免费观看视频re| 国模少妇一区二区三区| 国产呻吟高潮| 欧美人妖一区二区三区| 亚洲国产欧美一区二区丝袜黑人| 狠狠色狠狠综合久久| 久久精品国语| 国产欧美一区二区精品久久| 欧美日韩久久一区二区| 国产精品理人伦一区二区三区 | 99精品欧美一区二区三区美图| 国产精品久久99| 国产精品久久人人做人人爽| 福利片91| 国产精品国产亚洲精品看不卡15 | 精品一区中文字幕| 日本一区二区三区免费播放| 欧美三区视频| 99国产精品九九视频免费看| 午夜av免费观看| 99精品在免费线偷拍| 日本一区免费视频| 亚洲欧美日韩视频一区| 一区二区中文字幕在线| 粉嫩久久99精品久久久久久夜| 国产高清在线一区| 午夜av男人的天堂| 日本午夜一区二区| 国产一区精品在线观看| 亚洲精品乱码久久久久久按摩| 日本高清一二三区| 视频一区二区中文字幕| 国产一级一区二区三区| 大伊人av| 国产伦精品一区二区三区四区| 狠狠躁日日躁狂躁夜夜躁| 中文乱码字幕永久永久电影| 国产床戏无遮挡免费观看网站 | 日韩欧美国产精品一区| 欧美一区二区三区免费在线观看| 午夜三级电影院| 国产精品久久久久久久久久久新郎| 99久热精品| 精品福利一区| 国产精品欧美久久久久一区二区| 国产二区免费视频| 午夜影院伦理片| 国产精品久久久久久久久久久久久久久久久久 | 国产一区二三| 欧美精品日韩| 91夜夜夜| 在线精品视频一区| 在线观看v国产乱人精品一区二区| 狠狠色噜噜狠狠狠狠色综合久老司机| 亚洲欧美国产一区二区三区| 国产一区二区高潮| 久久久久久中文字幕 | 日本神影院一区二区三区| 国产精品久久久久久久妇女| 91精品国产综合久久福利软件| 久久一区欧美| 久久久久国产精品www| 午夜免费一级片| 国产精品天堂网| 麻豆91在线| 欧美激情国产一区| 色综合久久精品| 日本大码bbw肉感高潮| 搡少妇在线视频中文字幕| 国产女人和拘做受视频免费| 中文字幕区一区二| 欧美一区视频观看| 躁躁躁日日躁网站| 久久一区二区三区视频| 99久国产| 夜夜嗨av一区二区三区中文字幕 | 国产99久久久久久免费看| 99精品久久99久久久久| 亚洲色欲色欲www| 午夜av电影院| 国产精品6699| 99riav3国产精品视频| 国产欧美一区二区三区免费视频| 色乱码一区二区三区网站| 蜜臀久久99精品久久久久久网站| 午夜av男人的天堂| 少妇高潮在线观看| 午夜特级片| 亚洲欧洲另类精品久久综合| 欧美三级午夜理伦三级中视频 | 亚洲国产精品国自产拍久久| 久久精品中文字幕一区| 91亚洲精品国偷拍自产| 国产欧美三区| 久久激情图片| 欧美一区二区免费视频| 久久久久国产一区二区三区不卡| 国产伦精品一区二区三| 狠狠色噜噜狠狠狠狠2021天天| 精品国产乱码久久久久久久| 国产精华一区二区精华| 午夜肉伦伦影院九七影网| **毛片免费| 夜色av网| 大bbw大bbw巨大bbw看看| 九九国产精品视频| 午夜亚洲影院| 国产资源一区二区| 亚洲免费永久精品国产| 狠狠色噜噜狠狠狠狠88| 国产一区不卡视频| 91一区在线| 国产欧美日韩一级| 四虎国产永久在线精品| 国产欧美视频一区二区三区| 欧美日韩中文国产一区发布| 国产精品视频二区三区| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 亚洲欧美一区二| 国产91高清| 国产精品一二二区| 精品国产一二区| 一区二区久久精品66国产精品| 亚洲少妇一区二区三区| 免费看农村bbwbbw高潮| 午夜av电影网| 偷拍精品一区二区三区| 午夜一区二区三区在线观看| 视频国产一区二区| 少妇又紧又色又爽又刺激的视频| 日韩精品乱码久久久久久| 亚洲精品一区在线| 中文字幕制服狠久久日韩二区| 日韩av中文字幕第一页| 午夜在线观看av| 国产精品6699| 国产日韩欧美二区| 国内揄拍国产精品| 中文字幕在线乱码不卡二区区| 狠狠色噜噜狠狠狠狠69| 亚洲少妇一区二区| 日韩精品1区2区3区| 国产高清在线一区| 91波多野结衣| 中文字幕久久精品一区| 精品国产一区二区三区高潮视| 日韩av中文字幕在线| 色综合久久88| 精品久久小视频|