[發明專利]一種基于功能語義關聯計算的Mashup服務特征表示方法有效
| 申請號: | 202010127362.2 | 申請日: | 2020-02-28 |
| 公開(公告)號: | CN111475608B | 公開(公告)日: | 2022-06-17 |
| 發明(設計)人: | 陸佳煒;吳涵;馬超治;張元鳴;高飛;肖剛 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/289;G06F40/30;G06F40/247;G06K9/62 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 功能 語義 關聯 計算 mashup 服務 特征 表示 方法 | ||
一種基于功能語義關聯計算的Mashup服務特征表示方法,所述方法包括以下步驟:第一步、對所有需要特征表示的Mashup服務數據進行預處理;第二步、基于預處理后的Mashup服務數據,進行功能名詞提取操作;第三步、對于每條Mashup服務的功能名詞集合FS,對每個功能名詞的語義權重進行語義關聯計算;第四步、基于第三步的語義權重計算結果,結合TF?IDF算法與Word2Vec模型,進行Mashup語義特征向量的表示。本發明能夠有效提升Mashup服務的匹配精度,以及服務搜索效率。
技術領域
本發明涉及Mashup服務聚類領域,具體涉及一種基于功能語義關聯計算的Mashup服務特征表示方法。
背景技術
近年來,隨著大數據、云計算、移動互聯網等信息技術的不斷發展,Web服務所面臨的業務場景也更加多樣復雜,傳統的單功能服務已經無法滿足現實中靈活多變的用戶需求。在這種背景下,Mashup技術被認為是解決該問題的一個關鍵途徑。Mashup技術通過混搭多種不同功能的Web API服務,從而構建出一種全新的Web應用—Mashup服務。這一便捷高效的開發技術極大的提升了軟件開發人員對于組合級應用的開發效率,它允許軟件開發人員從類似ProgrammableWeb這樣的公共服務倉庫中,挑選出若干合適的Web API進行Mashup服務構建。因此,對于軟件開發人員而言,如何挑選出最具參考價值的Mashup服務成為需要解決的重點問題。然而,主流的服務倉庫中注冊有數量龐大的Mashup服務,并且大多數的Mashup服務僅采用自然語言的方式對服務進行描述,缺乏規范性的Web服務描述語言(WSDL)文檔,這無疑給服務搜索工作增加了極大的難度。
為了能讓計算機精準定位滿足用戶需求的Mashup服務,國內外不少研究學者都將研究的重點聚焦于Mashup服務描述,利用TF-IDF、LDA、Word2Vec等模型來對服務描述文本進行功能特征表示,以此提升服務識別精度,加快服務搜索的效率。例如,Gao等人就利用TF-IDF技術將Mashup服務描述文本表示成TF-IDF向量,并在此基礎上對Mashup服務進行聚類、推薦等工作。Shi等人通過結合Word2Vec和LDA,設計出一種增強LDA模型,用于生成高質量的詞向量模型,進而提升Mashup服務的匹配精度。Cao等人利用Mashup服務的名稱、描述、標簽、類別、Web API等屬性構建出一種新穎的Mashup網絡模型,并結合LDA技術將該網絡模型整合到Mashup服務主題模型的計算過程中,有效的提升了Mashup服務的匹配精度及聚類性能。
發明內容
為了能夠有效提升Mashup服務的匹配精度,以及服務搜索效率。本發明提出了一種基于功能語義關聯計算的Mashup服務特征表示方法。該方法首先對每條Mahsup服務描述文本進行了規范化處理,并根據Web API組合的標簽對相應Mashup服務標簽進行擴充。在此基礎上,利用服務標簽以及服務描述中的功能名詞信息,進行功能語義關聯計算,并將其計算結果作為語義制約因子嵌入TF-IDF權重公式,使權重計算敏感于文檔的語義關聯變化。最后,將權重計算結果與Word2Vec詞向量相結合,構造出Mashup語義特征向量,使其更能反映服務真實的功能特征。
為了解決上述技術問題本發明所采用的技術方案是:
一種基于功能語義關聯計算的Mashup服務特征表示方法,包括以下步驟:
第一步、對所有需要特征表示的Mashup服務數據進行預處理,過程如下:
步驟(1.1)遍歷每條Mashup服務信息,針對性的提取出服務名稱、服務描述、WebAPI組合信息、類別信息以及標簽信息進行整理,進行步驟(1.2);
步驟(1.2)如果遇到缺失服務描述或描述內容過于簡短的情況,則直接將該服務剔除,進行步驟(1.3);
步驟(1.3)如果遇到缺失服務名稱的情況,則將設置特定的遞增序列號作為默認的服務名稱,進行步驟(1.4);
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010127362.2/2.html,轉載請聲明來源鉆瓜專利網。





