[發明專利]基于主題模型聚類的Web API推薦方法有效
| 申請號: | 202110508530.7 | 申請日: | 2021-05-11 |
| 公開(公告)號: | CN113343078B | 公開(公告)日: | 2022-07-15 |
| 發明(設計)人: | 陸佳煒;鄭嘉弘;趙偉;馬超治;徐俊;張元鳴;肖剛 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/35;G06F40/216;G06F40/284;G06K9/62 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 主題 模型 web api 推薦 方法 | ||
一種基于主題模型聚類的Web API推薦方法,根據上下文信息計算單詞的語義權重信息從而得到文檔?單詞語義權重信息矩陣D;統計單詞共現信息,從而計算出SPPMI矩陣信息;基于得到Mashup服務文檔單詞的詞頻信息矩陣D,單詞的上下文SPPMI矩陣M,通過分解M可以得到詞嵌入信息矩陣,進一步將上述兩種信息進行結合,計算服務的主題信息;將得到的Mashup服務主題特征,作為譜聚類的輸入進行聚類,通過對所有數據點組成的圖進行切圖,讓切圖后不同的子圖間邊權重和盡可能的低,子圖內的邊權重和盡可能的高,達到聚類的目的;結合GBDT和FM方法對Web API服務進行預測推薦。本發明有效實現Web API推薦。
技術領域
本發明涉及到一種針對Mashup服務構建基于主題模型聚類的Web API服務推薦方法。
背景技術
隨著互聯網技術的不斷成熟,服務互聯網化成本不斷降低,在服務計算“服務化”的思想驅動下,越來越多的公司將數據、資源或者相關業務發布到互聯網上,以提高信息的利用率和自身競爭力。然而傳統的服務大多數遵循簡單對象訪問協議,通常針對某一特定領域的業務需求,提供單一功能的服務,此外還存在技術體系復雜、擴展性差等問題,難以適應現實生活中復雜多變的應用場景。因此,對于Web服務提供商而言,如何能夠根據現實用戶以及自身業務需求的具體變動,快速地對已有的服務資源重新整合,成為一個亟待解決的問題。
為克服傳統服務帶來的問題,互聯網逐漸出現一種以混搭技術為基礎的Mashup服務,以緩解傳統服務難以適應復雜多變應用環境的問題。Mashup服務能將單一功能的服務和多種數據資源進行整合混搭,構建出綜合性的Web應用,從而滿足用戶多變的技術。Mashup服務開發十分便捷,軟件開發人員只需從服務注冊平臺,直接選取出若干合適的服務或者數據源,并按照相應的指示流程,便可以著手具有相應混合功能的Mashup服務的開發。由于Mashup服務適用性強,靈活度高,而且相對易于開發,Mashup服務逐漸受到企業和開發者的青睞。
然而,隨著互聯網上Web API服務數量的不斷增多,在Web API推薦中,推薦系統需要面對兩個問題:一是Mashup服務描述文檔通常比較簡短、特征稀疏、信息量少,如何有效地根據簡短的描述信息提取Mashup服務描述需求的潛在信息,二是Web API服務集合數量眾多,大大地增加推薦系統搜索相關聯API服務的工作量,如何快速的、有效地確定Web API服務候選集合。
發明內容
為了有效解決Web API推薦中的問題,本發明提出一種基于主題模型聚類的WebAPI推薦方法,該方法首先基于非負矩陣分解(Non-negative Matrix Factorization,NMF)方法提取Mashup服務需求,已有Mashup服務集以及Web API的主題特征,根據采用譜聚類算法對Mashup服務聚類后得到Mashup服務類簇后,將Mashup服務描述需求主題信息與類簇進行相似度計算,選擇最相近的Mashup類簇,根據類簇中已有的Mashup服務調用關系,確定推薦Web API的候選集合,最后結合梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)和因子分解機(Factorization Machine,FM)方法,對Web API推薦進行預測。
本發明所采用的技術方案是:
一種基于主題模型聚類的Web API推薦方法,所述方法包括如下步驟:
第一步:根據上下文信息計算單詞的語義權重信息從而得到文檔-單詞語義權重信息矩陣D;
第二步:統計單詞共現信息,從而計算出SPPMI矩陣信息;
第三步:基于第一步,第二步得到Mashup服務文檔單詞的詞頻信息矩陣D,單詞的上下文SPPMI矩陣M,通過分解M可以得到詞嵌入信息矩陣,進一步將上述兩種信息進行結合,計算服務的主題信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110508530.7/2.html,轉載請聲明來源鉆瓜專利網。





