[發明專利]面向交互視頻傳輸質量提升的混合學習方法、裝置及設備有效
| 申請號: | 202010954328.2 | 申請日: | 2020-09-11 |
| 公開(公告)號: | CN112367490B | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 張歡歡;周安福;張新宇;馬華東 | 申請(專利權)人: | 北京郵電大學 |
| 主分類號: | H04N7/14 | 分類號: | H04N7/14;H04N21/647 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 馬敬;項京 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 交互 視頻 傳輸 質量 提升 混合 學習方法 裝置 設備 | ||
1.一種面向交互視頻傳輸質量提升的混合學習方法,其特征在于,所述方法包括:
針對視頻通話的當前傳輸時隙,獲取上一傳輸時隙的傳輸參數及包間延遲序列,其中,所述包間延遲序列為所述當前傳輸時隙之前接收端所接收到的預設數量的數據包中相鄰數據包之間的包間延遲對應的序列;
將所述上一傳輸時隙的傳輸參數輸入碼率預測模型,確定所述當前傳輸時隙的備選傳輸碼率,作為第一備選傳輸碼率,其中,所述碼率預測模型為基于各個傳輸時隙對應的獎勵函數值調整模型參數得到的強化學習模型,所述每個傳輸時隙對應的獎勵函數值為根據該傳輸時隙的傳輸參數及其對應的預設權重確定的,所述碼率預測模型包括傳輸參數與備選傳輸碼率之間的對應關系;
根據公式計算所述當前傳輸時隙對應的網絡狀態標識值D(ti);其中,T為所述預設數量,T∈N+,i∈(1,2,...T-1),Δd(tT-i)為所述包間延遲序列中按照時間由早到晚的順序的第T-i個包間延遲;
根據公式γ(ti)=γ(ti-1)+kγ×(|D(ti)|-γ(ti-1)),計算所述當前傳輸時隙對應的網絡狀態閾值γ(ti);其中,γ(ti-1)為所述上一傳輸時隙對應的網絡狀態閾值,kγ為預設的閾值權重系數,D(ti)為所述當前傳輸時隙對應的網絡狀態標識值,所述網絡狀態閾值的初始值為基于歷史通話的包間延遲確定的;
如果所述網絡狀態標識值不大于所述當前傳輸時隙對應的網絡狀態閾值,基于所述第一備選傳輸碼率向接收端發送數據包;
如果所述網絡狀態標識值大于所述當前傳輸時隙對應的網絡狀態閾值,基于預設的傳輸碼率調整規則、所述上一傳輸時隙的傳輸碼率及所述上一傳輸時隙的傳輸參數,確定所述當前傳輸時隙的備選傳輸碼率,作為第二備選傳輸碼率,并基于所述第二備選傳輸碼率向接收端發送數據包,其中,所述傳輸碼率調整規則為降低傳輸碼率的規則。
2.根據權利要求1所述的方法,其特征在于,在所述基于所述第一備選傳輸碼率向接收端發送數據包的步驟之后,所述方法還包括:
獲取所述當前傳輸時隙的傳輸參數,作為目標傳輸參數;
基于所述目標傳輸參數包括的參數及其對應的預設權重,確定所述當前傳輸時隙的獎勵函數值,作為第一獎勵函數值;
基于所述第一獎勵函數值調整所述碼率預測模型的參數。
3.根據權利要求1所述的方法,其特征在于,在所述基于所述第二備選傳輸碼率向接收端發送數據包的步驟之后,所述方法還包括:
獲取所述當前傳輸時隙的傳輸參數,作為目標傳輸參數;
基于所述目標傳輸參數包括的第一類參數及其對應的預設權重,以及第二類參數及其對應的預設權重和第一調整系數,確定所述當前傳輸時隙的獎勵函數值,作為第二獎勵函數值,其中,第二類參數為包間延遲;
基于所述第二獎勵函數值調整所述碼率預測模型的參數。
4.根據權利要求2或3所述的方法,其特征在于,所述傳輸參數還包括碼率差異,所述碼率差異為預測的傳輸碼率與實際發送碼率之間的差異;
在所述確定所述當前傳輸時隙的獎勵函數值的步驟之后,所述方法還包括:
當確定所述當前傳輸時隙對應的碼率差異大于預設差異閾值時,計算預設的第二調整系數與所述當前傳輸時隙的獎勵函數值的乘積,將所述乘積確定為所述當前傳輸時隙的獎勵函數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學,未經北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010954328.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:成人康復??菩g語標準化系統
- 下一篇:一種內生安全負載均衡服務器的構造方法





