[發(fā)明專利]一種字符串的比較方法及裝置有效
| 申請?zhí)枺?/td> | 201210068746.7 | 申請日: | 2012-03-15 |
| 公開(公告)號: | CN103309893A | 公開(公告)日: | 2013-09-18 |
| 發(fā)明(設計)人: | 韓軍東 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 字符串 比較 方法 裝置 | ||
技術領域
本申請涉及計算機計算領域,尤其涉及一種字符串的比較方法及裝置。
背景技術
目前,在互聯(lián)網(wǎng)的業(yè)務開發(fā)和實施環(huán)境中,海量數(shù)據(jù)處理運算的任務日益增多,這些海量數(shù)據(jù)處理運算有些是以字符串運算為中心的,其中,比較多個字符串諸如多個網(wǎng)頁地址(URL)是否相同的運算又占據(jù)了極高的比例。
傳統(tǒng)的判斷字符串是否相同的運算是通過諸如Strcmp函數(shù)實現(xiàn)的,對于兩個需要進行判同操作(判斷是否相同的操作)的字符串,從兩個字符串的頭部開始掃描比對每個字符是否相同,即字符串中有多少個字符就需要比對多少次,才能得到兩個字符串判同的結果。在海量數(shù)據(jù)處理運算中重復執(zhí)行判同操作的比率非常的高。例如,在字符串s1和s2進行判同之后,s1還可能和s3、s4、...sn進行判同操作,使用上述這種字符串的判同方式,每次字符串判同都需要比對多次才能得到判同結果,因此,整體的字符串判同效率較低,尤其是對于很長的字符串進行判同操作時上述問題特別突出。
發(fā)明內容
本申請實施例提供了一種字符串的比較方法及裝置,用以實現(xiàn)在互聯(lián)網(wǎng)的業(yè)務開發(fā)和實施環(huán)境中存在重復執(zhí)行海量數(shù)據(jù)處理運算的判同操作時能夠快速地得到字符串的判同結果。
本申請實施例提供的一種字符串的比較方法,包括:
針對至少兩個待比較的字符串,判斷每個字符串是否存在對應的摘要特征值;
對于不存在對應的摘要特征值的字符串,計算并保存所述字符串的摘要特征值;
比較所述至少兩個字符串的摘要特征值是否相同;若是,確定所述至少兩個字符串相同;若否,確定所述至少兩個字符串不同。
本申請實施例提供的一種字符串的比較裝置,包括:
第一判斷模塊,用于針對至少兩個待比較的字符串,判斷每個字符串是否存在對應的摘要特征值;
計算模塊,用于對于不存在對應的摘要特征值的字符串,計算并保存所述字符串的摘要特征值;
第二判斷模塊,用于比較所述至少兩個字符串的摘要特征值是否相同;若是,確定所述至少兩個字符串相同;若否,確定所述至少兩個字符串不同。
本申請實施例的有益效果包括:
本申請實施例提供的一種字符串的比較方法及裝置,針對至少兩個待比較的字符串,判斷每個字符串是否存在對應的摘要特征值;對于不存在對應的摘要特征值的字符串,計算并保存字符串的摘要特征值;比較至少兩個字符串的摘要特征值是否相同;若是,確定至少兩個字符串相同;若否,確定至少兩個字符串不同。在互聯(lián)網(wǎng)的業(yè)務開發(fā)和實施環(huán)境中存在重復執(zhí)行海量數(shù)據(jù)處理運算的判同操作時,由于使用字符串對應的摘要特征值進行比對得到字符串的判同結果,相對于對兩個字符串中的每個字符都要進行比對才能得到判同結果的方式,由于摘要特征值的數(shù)據(jù)量往往遠小于字符串的數(shù)據(jù)量,對摘要特征值進行比對得到判同結果,能夠大量的減少判同操作的計算量,這節(jié)省了運算資源,提升了整體的字符串判同效率。
附圖說明
圖1為本申請實施例提供的字符串的比較方法的流程圖;
圖2為本申請實施例提供的字符串的比較裝置的結構示意圖。
具體實施方式
下面結合附圖,對本申請實施例提供的字符串的比較方法及裝置的具體實施方式進行詳細地說明。
本申請實施例提供的一種字符串的比較方法,如圖1所示,具體流程包括以下步驟:
S101、針對至少兩個待比較的字符串,判斷每個字符串是否存在對應的摘要特征值;若是,執(zhí)行步驟S103;若否,執(zhí)行步驟S102;
S102、對于不存在對應的摘要特征值的字符串,計算并保存字符串的摘要特征值;
S103、比較至少兩個字符串的摘要特征值是否相同;若是,執(zhí)行步驟S104;若否,執(zhí)行步驟S105;
S104、確定至少兩個字符串相同;
S105、確定至少兩個字符串不同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210068746.7/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





