[發(fā)明專利]部分可觀測(cè)馬爾可夫決策過程中可伸縮視頻流的優(yōu)化調(diào)度方法有效
| 申請(qǐng)?zhí)枺?/td> | 200910196540.0 | 申請(qǐng)日: | 2009-09-25 |
| 公開(公告)號(hào): | CN101674482A | 公開(公告)日: | 2010-03-17 |
| 發(fā)明(設(shè)計(jì))人: | 鄒君妮;范鳳軍;彭兵;汪敏 | 申請(qǐng)(專利權(quán))人: | 上海大學(xué) |
| 主分類號(hào): | H04N7/30 | 分類號(hào): | H04N7/30 |
| 代理公司: | 上海上大專利事務(wù)所(普通合伙) | 代理人: | 陸聰明 |
| 地址: | 200444*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 部分 觀測(cè) 馬爾可夫 決策 過程 伸縮 視頻 優(yōu)化 調(diào)度 方法 | ||
1.一種部分可觀測(cè)馬爾可夫決策過程中可伸縮視頻流的優(yōu)化調(diào)度方法,其特征在于,針對(duì)無線廣播下的環(huán)境進(jìn)行假設(shè)簡(jiǎn)化,在用戶狀態(tài)不確定或部分可觀測(cè)的條件下,對(duì)可伸縮視頻流進(jìn)行調(diào)度,采用部分可觀測(cè)馬爾可夫決策過程建立數(shù)據(jù)包調(diào)度優(yōu)化模型,該模型包括狀態(tài)集合、行動(dòng)集合、狀態(tài)轉(zhuǎn)移概率、報(bào)酬函數(shù)、觀察集合、觀察概率,給出具體的調(diào)度過程,其具體步驟如下:
(1)、假設(shè)一個(gè)無線廣播傳輸環(huán)境模型,其具體為:
(1-1)、AP需要將視頻流發(fā)送給M個(gè)接收者r1,r2,…,rM;
(1-2)、AP需要在N個(gè)時(shí)隙內(nèi)將L個(gè)包的集合L={l1,l2,…,lL}發(fā)送給接收者;
(1-3)、每一幀數(shù)據(jù)(L個(gè)包)的最大發(fā)送時(shí)間均為N個(gè)時(shí)隙,N個(gè)時(shí)隙結(jié)束之后,AP轉(zhuǎn)向下一幀數(shù)據(jù)包的發(fā)送;
(1-4)、AP轉(zhuǎn)發(fā)1個(gè)數(shù)據(jù)包的時(shí)間是一個(gè)時(shí)隙;
(1-5)、假設(shè)無線信道的丟包率服從參數(shù)為pi的伯努利分布;
(2)、分別對(duì)可伸縮視頻流的每一幀數(shù)據(jù)分為L(zhǎng)層,每層打包為一個(gè)數(shù)據(jù)包,每一幀的數(shù)據(jù)包集合記為L(zhǎng)={l1,l2,…,lL},設(shè)立數(shù)據(jù)包調(diào)度優(yōu)化模型,具體步驟為:
(2-1)、狀態(tài)集合:在任一給定的時(shí)間節(jié)點(diǎn),假設(shè)接收者rm收到了若干數(shù)據(jù)包,它是L的一個(gè)子集,該子集可以用L位矢量表示,即?其中b∈{0,1},bi=1表示rm擁有數(shù)據(jù)包li,否則bi=0,共有M個(gè)接收者,系統(tǒng)的狀態(tài)s用一個(gè)矩陣來表示:?系統(tǒng)一共有2M×L個(gè)狀態(tài),
表示M個(gè)用戶擁有的數(shù)據(jù)包的狀態(tài)集合,?表示對(duì)應(yīng)狀態(tài)的概率分布?
(2-2)、行動(dòng)集合:A={a1,a2,…,aL}表示M個(gè)用戶擁有的數(shù)據(jù)包的行動(dòng)集合,在每一個(gè)時(shí)隙內(nèi)AP選擇一個(gè)需要發(fā)送的數(shù)據(jù)包,al表示“發(fā)送第l個(gè)數(shù)據(jù)包”;
(2-3)、狀態(tài)轉(zhuǎn)移概率:在給定參數(shù)為pi的伯努利丟包模型下,可以直接計(jì)算出狀態(tài)轉(zhuǎn)移?概率P(st+1=s′|st=s,at=a),例如,發(fā)送兩個(gè)包到兩個(gè)接收者,M=2,L=2,假設(shè)?在t時(shí)刻,系統(tǒng)處在s狀態(tài),即r1擁有數(shù)據(jù)包l1,r2擁有數(shù)據(jù)包l2,此時(shí),AP選擇行動(dòng)a1=“發(fā)送l1”,那么轉(zhuǎn)移到狀態(tài)s′的概率是P(st+1=s′|st=s,at=a)=0;如果選擇行動(dòng)a2=“發(fā)送l2”,那么轉(zhuǎn)移到的概率是P(st+1=s′|st=s,at=a)=1-p1;
(2-4)、報(bào)酬函數(shù):報(bào)酬函數(shù)的選擇必須使每一時(shí)間節(jié)點(diǎn)下的瞬時(shí)報(bào)酬r(s,a)的總和能準(zhǔn)確地反應(yīng)既定目標(biāo)——視頻流質(zhì)量的最優(yōu)化,可以把接收者接收到每一個(gè)特定數(shù)據(jù)包所減少的失真作為瞬時(shí)報(bào)酬,視頻質(zhì)量最優(yōu)等價(jià)于所有M個(gè)用戶的視頻失真總和最小;
采取行動(dòng)a后的狀態(tài)轉(zhuǎn)移概率已知,瞬時(shí)報(bào)酬r(s,a)可以通過下式計(jì)算
;
(2-5)、觀察集合:O表示AP能觀察到的觀察集合,O={ACK,NAK},o(t)={o1(t),o2(t),…,oM(t)}表示在t時(shí)刻M個(gè)用戶的聯(lián)合觀察,oi(t)∈{ACK,NAK},其中
ACK:確認(rèn)收到數(shù)據(jù)包的反饋;
NAK:沒有收到數(shù)據(jù)包的反饋;
(2-6)、觀察概率:觀察結(jié)果的不確定性,觀察結(jié)果o在狀態(tài)s下采取行動(dòng)a后,用一個(gè)條件概率函數(shù)Z(s,a,o)=pr(o?|s,a)來給出;
(3)、對(duì)可伸縮視頻流優(yōu)化調(diào)度:假設(shè)初始信念狀態(tài)為:?設(shè)定第2M×L個(gè)狀態(tài)為所有接收者成功接收到所有數(shù)據(jù)包的目標(biāo)狀態(tài),針對(duì)某一幀數(shù)據(jù)包的具體調(diào)度步驟如下:
(3-1)、部分可觀測(cè)馬爾可夫決策過程的參數(shù)輸入:初始信念狀態(tài)?
(3-2)、選擇需要發(fā)送的數(shù)據(jù)包:在每一個(gè)時(shí)隙內(nèi)AP通過下式選擇需要發(fā)送的數(shù)據(jù)包,
其中∏1(b0,t0)表示一步部分可觀測(cè)馬爾可夫決策過程需要發(fā)送的最優(yōu)數(shù)據(jù)包;?表示t0時(shí)刻在初始信念為b0的情況下,發(fā)送第k個(gè)數(shù)據(jù)包后第m個(gè)用戶獲得的一步失真減少;Ω(t)表示在t時(shí)刻需要發(fā)送的數(shù)據(jù)包的集合,初始時(shí)刻的Ω(t0)={1,2,…,L};
(3-3)、信念狀態(tài)更新一次:每發(fā)送一個(gè)數(shù)據(jù)包,進(jìn)行一次聯(lián)合觀察o,o(t)={o1(t),o2(t),…,oM(t)},其中oi(t)∈{ACK,NAK},系統(tǒng)發(fā)生狀態(tài)轉(zhuǎn)移,從狀態(tài)si轉(zhuǎn)移到狀態(tài)sj,根據(jù)接收到的反饋的不同,sj的取值一共有2M種情況,即?的一次更新過程如下:
收益值為:
H1(b0,t0)表示一步部分可觀測(cè)馬爾可夫決策過程的收益值,每發(fā)送一次,概率更新一次,狀態(tài)的確定度越來越大;
(3-4)、判斷發(fā)送時(shí)隙n是否大于最大發(fā)送時(shí)隙數(shù)N,若大于,則轉(zhuǎn)移到下一幀的數(shù)據(jù)包?進(jìn)行發(fā)送;否則接著發(fā)送此幀的數(shù)據(jù)包。經(jīng)過n步后,部分可觀測(cè)馬爾可夫決策過程的最大失真減少及其最優(yōu)策略分別如下:
經(jīng)過N個(gè)時(shí)隙后轉(zhuǎn)移到下一幀數(shù)據(jù)包的調(diào)度,直至H幀的視頻流的數(shù)據(jù)包調(diào)度完成。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海大學(xué),未經(jīng)上海大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910196540.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 觀測(cè)設(shè)備、觀測(cè)程序和觀測(cè)方法
- 觀測(cè)系統(tǒng)、觀測(cè)程序和觀測(cè)方法
- 一種便于分層觀測(cè)的基坑回彈觀測(cè)標(biāo)志及觀測(cè)方法
- 一種確定被觀測(cè)目標(biāo)的經(jīng)緯度的方法及一種觀測(cè)平臺(tái)
- 觀測(cè)裝置、觀測(cè)方法以及觀測(cè)程序
- 多星任務(wù)的合成方法和系統(tǒng)
- 衛(wèi)星觀測(cè)值獲取方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種減少用于觀測(cè)空間目標(biāo)的觀測(cè)衛(wèi)星的數(shù)目的方法
- 在軌伽馬射線暴機(jī)會(huì)目標(biāo)觀測(cè)方法
- 在軌伽馬射線暴機(jī)會(huì)目標(biāo)觀測(cè)方法
- 認(rèn)知無線電系統(tǒng)中基于隱馬爾可夫模型的頻譜接入方法
- 一種基于馬爾可夫轉(zhuǎn)移矩陣庫(kù)的寄生電阻提取方法
- 一種基于馬爾可夫轉(zhuǎn)移矩陣庫(kù)的寄生電容提取方法
- 用于對(duì)技術(shù)系統(tǒng)進(jìn)行建模的方法
- 基于高斯混合的因子隱馬爾可夫負(fù)荷分解方法
- 一種含水層結(jié)構(gòu)變異轉(zhuǎn)移概率的地質(zhì)統(tǒng)計(jì)模擬方法及裝置
- 一種廣義馬爾可夫稠密光流確定方法及系統(tǒng)
- 一種應(yīng)用于復(fù)雜系統(tǒng)的馬爾可夫模型構(gòu)建簡(jiǎn)化方法及系統(tǒng)
- 基于馬爾可夫鏈的網(wǎng)絡(luò)攻擊階段統(tǒng)計(jì)和預(yù)測(cè)方法
- 基于多尺度馬爾可夫隨機(jī)場(chǎng)的聲學(xué)成像探測(cè)方法
- 決策協(xié)調(diào)方法、執(zhí)行裝置和決策協(xié)調(diào)器
- 一種基于循環(huán)更新模式的決策樹構(gòu)建方法
- 一種基于群決策的建筑項(xiàng)目決策系統(tǒng)及決策方法
- 一種基于反射弧的智慧大腦決策系統(tǒng)及決策方法
- 一種三維消防指揮決策輔助系統(tǒng)
- 一種決策方法、系統(tǒng)以及電子設(shè)備
- 基于決策引擎和模型平臺(tái)的業(yè)務(wù)決策邏輯更新方法
- 一種雙層優(yōu)先級(jí)決策系統(tǒng)
- 一種應(yīng)用程序的業(yè)務(wù)執(zhí)行方法、裝置及電子設(shè)備
- 基于區(qū)塊鏈的決策方法及裝置和電子設(shè)備





