[發(fā)明專利]一種調(diào)度器及其減少異步迭代處理中冗余開銷的方法有效

申請?zhí)枺?/td>	201310173239.4	申請日：	2013-05-10
公開（公告）號：	CN103309942A	公開（公告）日：	2013-09-18
發(fā)明（設計）人：	廖小飛;金海;張宇	申請（專利權）人：	華中科技大學
主分類號：	G06F17/30	分類號：	G06F17/30
代理公司：	華中科技大學專利中心 42201	代理人：	朱仁玲
地址：	430074 湖北***	國省代碼：	湖北;42
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種調(diào)度及其減少異步處理冗余開銷方法
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發(fā)明屬于大數(shù)據(jù)處理領域，更具體地，涉及一種調(diào)度器及其減少異步迭代處理中冗余開銷的方法。

背景技術

異步迭代處理普遍存在于萬維網(wǎng)應用，數(shù)據(jù)挖掘和科學計算等領域中，例如：萬維網(wǎng)搜索引擎中的PageRank算法,鏈接分析和推薦系統(tǒng)中的Adsorption算法,以及用于解決線性方程組的Jacobi方法，它允許前面迭代中產(chǎn)生的中間結果立即被用于目前迭代中的計算,加快迭代計算的收斂速度，并且不存在負載均衡問題而使得云計算基礎設施得到更好的應用。

然而，當有很多可用的中間結果可用時，異步迭代處理就會由于下面兩個原因觸發(fā)后續(xù)迭代中大量沒必要的計算開銷和通信開銷：一）盲目的選擇一個中間結果進行處理，而不考慮每個數(shù)據(jù)對收斂速度的影響和首先處理它們將引起的開銷；二）為每一個中間結果都在后續(xù)迭代中級聯(lián)觸發(fā)大量的計算和通信開銷，從而使得異步迭代處理對大多數(shù)迭代應用會引起大量冗余計算和通信開銷，減慢異步迭代處理的收斂速度，浪費大量計算機資源，實際上，這些冗余觸發(fā)可以通過調(diào)度算發(fā)被避免掉，然而目前所有的用于異步迭代處理的調(diào)度算法，例如：優(yōu)先級調(diào)度（Priority?scheduling）、輪詢調(diào)度（Round-robin?scheduling）等，在選擇一個中間結果進行處理時，都不考慮首先處理這些中間結果的開銷。同時，這些調(diào)度算法都不是以組的形式進行調(diào)度的，從而需要為每一個中間結果數(shù)據(jù)級聯(lián)觸發(fā)后續(xù)迭代中的計算和通信，最終使得使用這些調(diào)度算法的異步迭代處理對于很多迭代應用仍然存在大量的級聯(lián)性的計算和通信冗余開銷。然而，這些冗余計算和通信開銷會大量的浪費了計算機資源，并減慢了迭代計算的收斂速度。

發(fā)明內(nèi)容

針對現(xiàn)有技術的以上缺陷或改進需求，本發(fā)明提供了一種減少異步迭代處理中冗余開銷的方法，其目的在于解決現(xiàn)有方法中存在的冗余計算和通信開銷大、計算機資源浪費、迭代計算的收斂速度慢的問題。

為實現(xiàn)上述目的，按照本發(fā)明的一個方面，提供了一種減少異步迭代處理中冗余開銷的方法，其應用在一種調(diào)度器中，該調(diào)度器分別與任務執(zhí)行器和消息接收器通訊連接，該方法包括以下步驟：

（1）建立一個哈希表，每一表項對應一個數(shù)據(jù)組，其中每一表項又包括三個域：第一個域用于存儲數(shù)據(jù)組的鍵值，第二個域用于數(shù)據(jù)組的權值，第三個域用于存儲數(shù)據(jù)組中的數(shù)據(jù)列表，數(shù)據(jù)列表中包括數(shù)據(jù)的值、以及數(shù)據(jù)所在的迭代層次；

（2）接收來自于消息接收器的數(shù)據(jù)D；

（3）根據(jù)該數(shù)據(jù)D的ITC值和IN值計算該數(shù)據(jù)D的權值Pri(D)，具體包括以下子步驟：

（3-1）計算數(shù)據(jù)D的ITC值ITC(D)和IN值IN(D)，其中ITC(D)＝±D，IN(D)是記錄在數(shù)據(jù)D中的信息，其具體為數(shù)據(jù)D的最初原始數(shù)據(jù)變化到數(shù)據(jù)D期間所處理的次數(shù)；

（3-2）根據(jù)ITC（D）和IN(D)并利用以下等式計算數(shù)據(jù)D的權值Pri(D)：Pri(D)＝t₁×ITC(D)+t₂×IN(D)/T，其中t₁和t₂分別為表示ITC（D）和IN(D)重要性的權重值，且其取值為0至1之間的小數(shù)，T為調(diào)整IN(D)取值范圍的值，其取值范圍是大于1的整數(shù)；

（4）判斷在哈希表中是否存在與該數(shù)據(jù)D具有相同鍵值的數(shù)據(jù)組G(D)存在，若存在則更新該數(shù)據(jù)組G(D)的權值和數(shù)據(jù)列表，否則在哈希列表中創(chuàng)建與該數(shù)據(jù)D相同鍵值的數(shù)據(jù)組G(D)，并進行初始化，

（5）判斷任務執(zhí)行器是否空閑，如果是則進入步驟（6），否則返回步驟（2）；

（6）從哈希表中選擇權值最大的一個數(shù)據(jù)組，將該數(shù)據(jù)組對應的數(shù)據(jù)傳送給任務執(zhí)行器處理，然后進入步驟（7）；

（7）判斷任務執(zhí)行器中運行的應用程序是否結束，如果是則過程結束，否則轉入步驟（8）；

（8）判斷哈希表中是否還有未處理的數(shù)據(jù)組，如果有則返回步驟（5），否則返回步驟（2）。

優(yōu)選地，步驟（4）包括以下子步驟：

（4-1）獲得數(shù)據(jù)D的鍵值D_key，對該鍵值進行哈希函數(shù)處理以獲得一個唯一組標識K；

（4-2）根據(jù)該唯一標識K在哈希表中進行查詢，以判斷是否有鍵值為D_key的數(shù)據(jù)組G(D)，若有,則轉入步驟（4-3），否則轉入步驟（4-4）；

（4-3）將數(shù)據(jù)D插入具有鍵值D_key的數(shù)據(jù)組G(D)中，然后轉入步驟（4-5）；

下載完整專利技術內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于華中科技大學，未經(jīng)華中科技大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201310173239.4/2.html，轉載請聲明來源鉆瓜專利網(wǎng)。