[發明專利]一種Web服務聚類的方法有效
| 申請號: | 201010613232.6 | 申請日: | 2010-12-30 |
| 公開(公告)號: | CN102043863A | 公開(公告)日: | 2011-05-04 |
| 發明(設計)人: | 吳健;馬瑩;王飛 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州裕陽專利事務所(普通合伙) 33221 | 代理人: | 江助菊 |
| 地址: | 310027 浙江省杭*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 web 服務 方法 | ||
1.一種Web服務聚類的方法,包括
Web服務庫(1):為存儲WDSL文檔的數據庫,用于給現有Web建立索引,支持數據存取和寫入;
主控裝置(2):它包括用戶交互裝置——為與用戶IO交互的各種驅動;計算處理裝置——包括內存,外存,CPU;用于獲取Web服務的向量模型、運算聚類結果;數據庫交互裝置——包括數據庫驅動及xml解析器,用戶終端,輸入輸出設備及顯示器,用于數據庫通信、及用戶對于某些場景或參數的選擇;
標簽庫(3):用于存儲以序號表示的不同的權重組合、類別標簽、及以索引形式存儲的Web服務庫中的Web服務,并存儲相應的哈希值,支持數據讀出及寫入;
其特征在于包括以下步驟:
步驟一:使用VSM方法將Web服務轉化為向量集合
a.主控裝置(2)從Web服務庫(1)中讀取當前所有Web服務的WDSL文檔數據,若用戶給定限制條件,則獲取符合條件的Web服務;
b.主控裝置(2)獲取Web服務后,使用VSM方法將Web服務集合轉化為向量空間集合;
所述VSM方法,是將每個所述WSDL文檔中的“Web服務基本信息的描述”、“功能操作”、“輸入參數”、“輸出參數”以及“Qos”分割成一組關鍵詞,表示為<?Des,?Oper,?Input,?Output,?Qos?>五個屬性,每一個關鍵詞代表一個維度,統計關鍵詞在文檔中的出現頻率,并計算每一維向量在每個文檔下的權重,進而將代表Web服務的WSDL文檔轉化為向量;
每一維向量在每個文檔下的權重為:
????其中表示第k個詞在WSDL文檔i中的權重,表示第k個詞在文檔i中出現的次數,N表示集合中的全部文檔數量,表示包含第k個詞的文檔數量,繼而采用公式
?
將值規范化,將每一維向量的權重值規范在?[0,1]之間取值,而||即為第k維向量的長度,其中,t為空間向量維數,即為t維空間向量中第k個位置的值;
步驟二:根據應用需求,確定Web服務的權重
主控裝置(2)向用戶發起詢問,詢問用戶是否自行標定Web服務上述五個屬性<?Des,?Oper,?Input,?Output,?Qos?>的權重值<?Des,Oper,Input,Output,Qos?>系數、、、、和,其中++++=1,若是,則由用戶輸入權重值,否則,使用該場景下的默認權重值系數,即=====0.2;?
步驟三:使用LSH方法對Web服務向量集合進行聚類
a.?主控裝置(2)獲取從上述步驟二中得到的標定好權重的向量集合,通過使用LSH方法順序處理各Web服務,計算每個Web服務對應的N個哈希值,?
其中,向量代表一個Web服務空間向量,是一個向量,其維度與相同,且服從高斯分布,b是一個范圍在[0,w]的隨機實數,w表示一個哈希桶的長度,為經驗值,由操作者給定,通常情況下,在Web服務集合數量不超過10000的情況下,w值取[4,6]效果較好;在w值給定的情況下,反復隨機選取向量和隨機實數b,獲取構建哈希函數的變量,得到N個哈希函數,形成哈希函數族;
b.?對N個哈希值都相同的Web服務進行處理,計算Web服務之間的距離,對于N個哈希值都相同的Web服務,將大多數距離相近的點標定為同一類,
c.?判定上一步所述的距離相近的點中是否存在奇異點,若Web服務不為奇異點,則對該Web服務進行標定處理:若標簽庫中已有大量數據,則將N個哈希值合并成一個序列,并在標簽庫(3)中查詢給定的權重值組合下該序列所對應的標簽,若不存在該標簽,則由主控裝置(2)向用戶發起詢問,用戶以文字形式為每個類別寫入標簽,若用戶不想手工處理,則可由主控裝置(2)標定隨機數字標簽;主控裝置(2)將Web服務以索引形式寫入標簽庫(3)中對應權重值及類別標簽下,并標定這些Web服務已經處理;若Web服務為奇異點,則對該Web服務不做處理;
d.?主控裝置(2)對所述奇異點進行處理,將其鄰近的若干個已寫入標簽庫(3)中Web服務進行投票,將該Web服務以索引形式寫入到標簽庫(3)中出現最頻繁的與該Web服務對應的權重值組合及類別標簽下,并標定該Web服務已被處理;
e.?主控裝置(2)向用戶發起詢問,是否繼續進行新一輪聚類,若是,則返回步驟三a.繼續進行,反之,則結束整個流程。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010613232.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種監控攝像機機罩清洗裝置
- 下一篇:應用于中藥材洗加工的裝置





