日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種Web環(huán)境下的字符串相似度的分析方法無(wú)效

專利信息
申請(qǐng)?zhí)枺?/td> 200910011738.7 申請(qǐng)日: 2009-05-27
公開(公告)號(hào): CN101561813A 公開(公告)日: 2009-10-21
發(fā)明(設(shè)計(jì))人: 于戈;申德榮;朱命冬;寇月;聶鐵錚;王振華 申請(qǐng)(專利權(quán))人: 東北大學(xué)
主分類號(hào): G06F17/30 分類號(hào): G06F17/30;G06F17/22
代理公司: 沈陽(yáng)東大專利代理有限公司 代理人: 李運(yùn)萍
地址: 110004遼寧省*** 國(guó)省代碼: 遼寧;21
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 web 環(huán)境 字符串 相似 分析 方法
【說(shuō)明書】:

技術(shù)領(lǐng)域

發(fā)明屬于計(jì)算機(jī)Web數(shù)據(jù)庫(kù)領(lǐng)域,特別適用于Web數(shù)據(jù)庫(kù)集成系統(tǒng)重復(fù)記錄識(shí)別過(guò)程中兩條記錄相似度的判定。

背景技術(shù)

在web環(huán)境中,對(duì)于需要進(jìn)行相似度匹配的字符串,常常會(huì)遇到拼寫錯(cuò)誤、關(guān)鍵詞順序顛倒、縮寫詞或省略詞匹配等情況,導(dǎo)致應(yīng)用于web環(huán)境下的字符串相似度分析方法面臨很多困難。因?yàn)榈湫偷某S米址嗨贫确治龇椒ㄍǔV会槍?duì)某一特定情況。如:Levenshteindistance較適合于拼寫錯(cuò)誤,Jaro?distance?metric較適合于縮寫詞或省略詞識(shí)別。在應(yīng)用中,常常需要人工來(lái)判斷何種環(huán)境下使用什么樣的算法。然而,web環(huán)境中多是半結(jié)構(gòu)和無(wú)結(jié)構(gòu)數(shù)據(jù),具體字符串的類型不容易判斷,因此無(wú)法保證應(yīng)用已有字符串匹配算法計(jì)算的字符串匹配的準(zhǔn)確度。

Levenshtein?Distance算法是首先由俄國(guó)科學(xué)家提出。在該方法中,求兩字符串之間的相似度的基本步驟如下:首先,建立編輯距離矩陣,然后,依次由左向右,由上向下計(jì)算矩陣單元的值,最后,矩陣中最右下矩陣單元的值即為兩字符串的編輯距離。該算法為較傳統(tǒng)的算法,優(yōu)點(diǎn)為過(guò)程簡(jiǎn)單,易于使用,但對(duì)逆序,縮寫詞匹配時(shí)效果不太好。

著名的Smih-Waternan算法,是在傳統(tǒng)的Levenshtein?distance基礎(chǔ)上改進(jìn)的算法。其基本步驟和Levenshtein?Distance算法只在計(jì)算矩陣單元值時(shí)不同。Smih-Waternan算法通過(guò)引入刪除補(bǔ)償、插入補(bǔ)償和替換補(bǔ)償三個(gè)參數(shù)來(lái)計(jì)算矩陣單元值。當(dāng)矩陣中所有的矩陣單元計(jì)算過(guò)以后,矩陣中最右下的矩陣單元值即為要計(jì)算的兩個(gè)字符串的編輯距離。該算法主要適用于尋找局部相似序列對(duì),其缺點(diǎn)是對(duì)于逆序詞效果不太好。

字符串相似度的Jaro分析方法的主要思想是計(jì)算兩個(gè)字符串σ1和σ2的Jaro距離為:,其中|σ1|,|σ2|分別為兩個(gè)字符長(zhǎng)度,c為兩字符串中的“公共子串”長(zhǎng)度,t為替換總數(shù),替換總數(shù)計(jì)算方法為:將σ1中的第i個(gè)公共字符與σ2中的第i個(gè)字符做比較,若做比較的兩個(gè)字符不相同則進(jìn)行一次替換。該算法的優(yōu)點(diǎn)是計(jì)算速度較快,對(duì)縮寫詞的識(shí)別準(zhǔn)確率較高。但該算法僅適合縮寫詞普遍存在的場(chǎng)合,對(duì)不是縮寫詞進(jìn)行比較時(shí)常常將兩詞的相似度錯(cuò)誤提高,導(dǎo)致失真。

發(fā)明內(nèi)容

為了解決已有技術(shù)的不足,本發(fā)明提供一種應(yīng)用于Web環(huán)境具有適應(yīng)性的字符串相似度分析方法——Ajusted-edit?distance分析方法,能很好地處理web中經(jīng)常出現(xiàn)的省略、縮寫和字符順序顛倒情況。

本發(fā)明的分析方法步驟如下:

步驟1.定義基本操作代價(jià),由刪除字符代價(jià),插入字符代價(jià),替換字符代價(jià)組成。其中:

刪除字符代價(jià)cost(a—>ε),表示刪除字符a的代價(jià);

插入字符代價(jià)cost(ε—>a),表示插入字符a的代價(jià);

替換字符代價(jià)cost(a—>a)和cost(a—>b),分別表示用字符a替換字符a的代價(jià)和用字符a替換字符b的代價(jià);

步驟2.字符串預(yù)處理,包括識(shí)別詞首字符和去除非實(shí)義字符。其中,詞首字符指字符串中第一個(gè)實(shí)義字符或字符串中非實(shí)義字符后的第一個(gè)實(shí)義字符;非實(shí)義字符是指不具有實(shí)際意義的字符,包括空格、逗號(hào)、括號(hào)。

步驟3.計(jì)算距離矩陣,通過(guò)創(chuàng)建匹配索引實(shí)現(xiàn)字符串中字符位置的交換,進(jìn)而優(yōu)化編輯距離。

其中,匹配索引是指將一個(gè)字符串以最小代價(jià)的編輯操作序列轉(zhuǎn)換成另一個(gè)字符串的過(guò)程中,原本被插入或刪除的字符通過(guò)改變字符順序能夠以更小的代價(jià)進(jìn)行替換的字符的索引。在進(jìn)行實(shí)際交換之前,需要先計(jì)算一下兩個(gè)字符串的距離變化,只有當(dāng)距離變化小于0時(shí)才進(jìn)行位置交換。

創(chuàng)建匹配索引方法的步驟如下:

A.計(jì)算兩個(gè)字符串的距離矩陣;

B.將所有代價(jià)為0的字符對(duì)添加到匹配索引中;

C.通過(guò)距離矩陣選出一個(gè)代價(jià)最小的替換方案;

D.過(guò)濾匹配索引中在轉(zhuǎn)換方案中已經(jīng)采用的代價(jià)為0的替換方案;

E.過(guò)濾匹配索引中包含在其他索引對(duì)中出現(xiàn)的字符的索引對(duì)

F.結(jié)束

優(yōu)化編輯距離的具體公式如下:

ed′(x,y)=ed(x,y)+distanceChange

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東北大學(xué),未經(jīng)東北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200910011738.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 亚洲第一天堂无码专区| 一区二区三区中文字幕| 国产一级片大全| 国产一区激情| 欧美视屏一区二区| 国产精品日韩一区二区三区| 国产在线干| 91丝袜诱惑| 久久婷婷国产香蕉| 91精品啪在线观看国产手机| 午夜黄色一级电影| 99re6国产露脸精品视频网站| 亚洲少妇中文字幕| 国产精品久久久视频| 日韩无遮挡免费视频| 日韩av免费电影| 岛国黄色av| 欧美高清性xxxxhd| 欧美精品综合视频| 久久国产精品久久久久久电车| 日韩国产欧美中文字幕| 性生交大片免费看潘金莲| 4399午夜理伦免费播放大全 | 国产天堂第一区| 亚洲制服丝袜在线| 国产伦理精品一区二区三区观看体验| 国产专区一区二区| 91精品国产91久久久| 国产欧美日韩一级| 国产一区二区在线精品| 日本免费电影一区二区| 不卡在线一区二区| 97精品国产97久久久久久粉红| 国产主播啪啪| 国产精品18久久久久白浆| 国产美女三级无套内谢| 国产在线精品一区| 国产精品99一区二区三区| 日韩欧美一区精品| 欧美一区免费| 中文字幕视频一区二区| 丰满岳乱妇bd在线观看k8| 蜜臀久久久久久999| 91黄色免费看| 欧美一区二区三区不卡视频| 一级女性全黄久久生活片免费| 国产二区视频在线播放| 91精品国产综合久久国产大片 | 99久久国产免费,99久久国产免费大片 | 日韩av三区| 99久久婷婷国产精品综合| 亚洲欧洲日韩av| 男女无遮挡xx00动态图120秒| 欧美日韩一区不卡| 亚洲日韩aⅴ在线视频| 国产伦精品一区二区三区照片91 | 欧美在线一级va免费观看| 国产午夜亚洲精品午夜鲁丝片| 精品国产一区二区三区麻豆免费观看完整版 | 中文字幕制服狠久久日韩二区| 精品国产91久久久| 日本边做饭边被躁bd在线看| 久久国产精品欧美| 强行挺进女警紧窄湿润| 欧美freesex极品少妇| 精品视频久| 国模少妇一区二区三区| 国产91麻豆视频| 国产精品视频久久| 国产偷国产偷亚洲清高| 99久久国产综合| 精品一区中文字幕| 婷婷午夜影院| 欧美色综合天天久久综合精品| 理论片高清免费理伦片| 91久久香蕉国产日韩欧美9色| 国产精品一二三区视频出来一| 夜夜躁人人爽天天天天大学生| 久久99久久99精品免观看软件| 性欧美一区二区| 国产日韩一区二区三免费| 亚洲乱玛2021| 国产69精品久久久久9999不卡免费| 国产日韩欧美自拍| 久久99国产综合精品| 久久国产精品-国产精品| 亚洲欧美一区二区精品久久久| 亚洲精品色婷婷| 青苹果av| 欧美日韩九区| 国产清纯白嫩初高生在线观看性色| 久久99久久99精品免观看软件| 国产在线拍偷自揄拍视频| 91视频国产一区| 国产69精品久久久久777糖心| 中文在线一区| 狠狠色综合久久婷婷色天使| 狠狠色狠狠色综合系列| 国产真实一区二区三区| 99re热精品视频国产免费| 91久久免费| 国产aⅴ一区二区| 男女视频一区二区三区| 欧美乱偷一区二区三区在线 | 久久精品国产99| 色妞妞www精品视频| 99re热精品视频国产免费| 日韩精品一二区| 国产91在线播放| 国产有码aaaae毛片视频| 亚洲福利视频二区| 秋霞三级伦理| 久久97国产| 亚洲精品20p| 久久99精品国产一区二区三区| 国产www亚洲а∨天堂| 欧美一区二区三区久久精品| 日韩国产精品一区二区| 国产精品久久久久久亚洲调教| 国产高清精品一区| 国产呻吟高潮| 国产日本欧美一区二区三区| 一区二区三区国产精华| 国产精品一区二区久久乐夜夜嗨| 国产日韩精品一区二区三区| 欧美日韩中文国产一区发布| 玖玖精品国产| 日本黄页在线观看| 国产88av| 中文av一区| 国产精品久久久av久久久| 欧美在线播放一区| 国产91在线播放| 国产精品第56页| 国产麻豆91欧美一区二区| 久久久久久久久亚洲精品| 99三级视频| 香蕉av一区二区三区| 国产精品二区一区二区aⅴ| 午夜精品在线观看| 日韩三区三区一区区欧69国产| 欧美资源一区| 色偷偷一区二区三区| 日本一区二区三区中文字幕| 又黄又爽又刺激久久久久亚洲精品 | 久久国产精品二区| 丰满少妇高潮惨叫久久久一| 国产精品久久91| 国产亚洲精品久久久久动| 国产99久久久国产精品免费看| 日本道欧美一区二区aaaa| 欧美日韩国产色综合视频| 狠狠干一区| 99精品少妇| 国产国产精品久久久久| 中文字幕av一区二区三区高| 亚洲自偷精品视频自拍| 日韩av中文字幕一区二区| 国产伦精品一区二区三区免费优势| 一区二区三区四区中文字幕| 免费视频拗女稀缺一区二区| 欧美在线视频一区二区三区| 国产videosfree性另类| 国产天堂第一区| 久久91久久久久麻豆精品| 国产精品99999999| 国产盗摄91精品一区二区三区| 国产一区二区三区的电影| 日韩av在线播| 中文字幕一区二区三区又粗| 精品国产乱码久久久久久免费| 欧美在线免费观看一区| 毛片大全免费看| 午夜wwww| 国产一区二区三区大片| 欧美一区二区三区久久久| 国产一区二区三区伦理| 国产一区二区在线免费| 欧美亚洲精品suv一区| 欧美一区视频观看| 91久久久久久亚洲精品禁果| 精品美女一区二区三区| 国产麻豆精品久久| 亚洲国产精品综合| 大伊人av| 欧美一区久久| 日韩精品中文字幕在线播放| 日韩精品在线一区二区三区| 国产一区二| 69精品久久| 在线中文字幕一区| 国产精品videossex国产高清| 欧美乱大交xxxxx胶衣| 亚洲一卡二卡在线| 88888888国产一区二区| 亚洲一区欧美| 欧美一区二三区| 国产69精品久久久久9999不卡免费| 欧美日韩久久一区二区| 久久网站精品| 国产一级片一区| 久久青草欧美一区二区三区| 国产一区二区大片| 狠狠色狠狠色很很综合很久久| 国产精品视频久久| 国产一二区视频| 久久99精品久久久大学生| 91午夜在线观看| 久久精品国产综合| 色就是色欧美亚洲| 日韩av在线导航| 国产精品伦一区二区三区在线观看 | 国产二区不卡| 久99久精品| 午夜色影院| 久久国产精品久久| 国产资源一区二区三区| 狠狠色噜噜狠狠狠狠| 毛片免费看看| 精品国产乱码久久久久久免费| 欧美日韩国产123| 88国产精品视频一区二区三区| 欧美一区二粉嫩精品国产一线天| 中文字幕欧美日韩一区 | 日韩久久精品一区二区三区| 高清欧美精品xxxxx| 国产色午夜婷婷一区二区三区| 91精品国产91热久久久做人人 | 91精品综合| 国产一区免费播放| 97精品国产97久久久久久粉红| 日本一二三区电影| 91国产一区二区| 狠狠色噜噜综合社区| 中文字幕在线视频一区二区| 亚洲乱亚洲乱妇28p| 国产精品偷伦一区二区| 99久久婷婷国产综合精品草原 | 国产又黄又硬又湿又黄| 久久er精品视频| 一区二区精品在线| 特级免费黄色片| 国产一卡二卡在线播放| 国产精品国产三级国产专区53| 91精品久| 精品国产乱码久久久久久久|