[發(fā)明專利]一種基于標(biāo)簽的web服務(wù)聚類方法有效
| 申請?zhí)枺?/td> | 201110440085.1 | 申請日: | 2011-11-30 |
| 公開(公告)號: | CN102622396A | 公開(公告)日: | 2012-08-01 |
| 發(fā)明(設(shè)計)人: | 吳健;馮怡鵬;陳亮;尹建偉;李瑩;鄧水光 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州裕陽專利事務(wù)所(普通合伙) 33221 | 代理人: | 江助菊 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 標(biāo)簽 web 服務(wù) 方法 | ||
1.一種基于標(biāo)簽的web服務(wù)聚類方法,其特征在于,包括如下步驟:
1)收集互聯(lián)網(wǎng)上web服務(wù)的WSDL文件和標(biāo)簽信息;
2)從WSDL文件中提取web服務(wù)的特征值,所述特征值包括內(nèi)容、類型、消息、端口和服務(wù)名稱;
3)對web服務(wù)的各個特征值和標(biāo)簽信息進行相似度計算,并根據(jù)特征值和標(biāo)簽信息的相似度值計算綜合相似度;
4)根據(jù)綜合相似度使用WTCluster算法對web服務(wù)進行聚類。
2.根據(jù)權(quán)利要求1所述的一種基于標(biāo)簽的web服務(wù)聚類方法,其特征在于,所述特征值內(nèi)容的提取包括如下步驟:
21)建立內(nèi)容特征向量:將WSDL文件的內(nèi)容根據(jù)空白符進行分割,進而得到初始內(nèi)容特征向量;
22)去除詞尾:利用波特詞干算法將詞干相同但后綴不同的單詞統(tǒng)一化;
23)噪聲過濾:在所述內(nèi)容向量中,過濾兩類沒有意義的單詞,第一種是XML標(biāo)簽,第二種是功能性詞匯;
判斷所述功能性詞匯的包括如下步驟,首先建立詞頻的泊松分布模型,為每個單詞w計算過估因子:
其中是通過泊松分布對w的估計詞頻,nw是實際在文本中統(tǒng)計的詞頻,過估因子越小,則單詞w越可能是功能性詞匯,設(shè)置閾值ΛT,過估因子小于該閾值的單詞將被認定為功能性詞匯而過濾掉,所述ΛT的選取如下:
其中,avg[Λ]是所有單詞統(tǒng)計詞頻nw的平均值;
24)精煉:在所述內(nèi)容特征向量中,通過設(shè)置閾值移除頻率過高的單詞得到一個web服務(wù)的內(nèi)容特征向量;
所述特征值內(nèi)容的相似度計算包括如下步驟:
25)使用NGD計算兩個web服務(wù)間的內(nèi)容相似度,對于兩個web服務(wù)s1、s2以及他們各自的內(nèi)容特征向量contents1、contents2,內(nèi)容特征向量中的單詞記為w,這兩個服務(wù)之間的內(nèi)容的相似度計算方式如下:
其中,|contents1|表示contents1中單詞的數(shù)量,兩個單詞之間的相似度計算公式為:
sim(wi,wj)=1-NGD(wi,wj)
所述NGD為正規(guī)化Google距離計算。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110440085.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 提供共享Web模塊的系統(tǒng)和方法
- 管理環(huán)球網(wǎng)網(wǎng)頁中的環(huán)球網(wǎng)媒體的系統(tǒng)及其實現(xiàn)方法
- 一種WEB業(yè)務(wù)實現(xiàn)系統(tǒng)、裝置及方法
- 高速緩存廣播信息的方法和裝置
- 基于QoS指標(biāo)和Web服務(wù)輸出參數(shù)的Web服務(wù)組合方法和裝置
- Web托管審查方法、裝置及Web托管系統(tǒng)
- 用于信息處理和Web瀏覽歷史導(dǎo)航的方法和設(shè)備及電子裝置
- 用于將web站點轉(zhuǎn)換為目標(biāo)web app站點的方法和裝置
- 用于防護WEB漏洞的方法和設(shè)備
- 一種Web攻擊報告生成方法、裝置、設(shè)備及計算機介質(zhì)
- 服務(wù)票據(jù)發(fā)行系統(tǒng)及服務(wù)票據(jù)發(fā)行服務(wù)
- 出租服務(wù)服務(wù)器和出租服務(wù)系統(tǒng)
- 服務(wù)開放方法及系統(tǒng)、服務(wù)開放服務(wù)器
- 基于服務(wù)券服務(wù)的在線企業(yè)服務(wù)平臺
- 退稅服務(wù)系統(tǒng)、退稅服務(wù)平臺及其服務(wù)方法
- 服務(wù)亭(服務(wù)驛站)
- 公共服務(wù)自助服務(wù)機
- 服務(wù)提供服務(wù)器、服務(wù)提供系統(tǒng)以及服務(wù)提供方法
- 服務(wù)提供服務(wù)器、服務(wù)提供系統(tǒng)以及服務(wù)提供方法
- 服務(wù)提供服務(wù)器、服務(wù)提供系統(tǒng)以及服務(wù)提供方法





