[發明專利]繪圖協議下的人工智能模型業務處理方法、裝置及設備在審
| 申請號: | 202110995308.4 | 申請日: | 2021-08-27 |
| 公開(公告)號: | CN113689322A | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 蔡耀華 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06T1/20 | 分類號: | G06T1/20;G06F7/483;G06N5/04 |
| 代理公司: | 北京君慧知識產權代理事務所(普通合伙) 11716 | 代理人: | 吳紹群 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 繪圖 協議 人工智能 模型 業務 處理 方法 裝置 設備 | ||
1.一種繪圖協議下的人工智能模型業務處理方法,包括:
獲取以第一數位浮點數表示的暫存數據,所述暫存數據是預先在指定的繪圖協議下,對人工智能模型提供的多個以第一數位浮點數表示的模型數據進行融合處理得到的,所述融合處理包括第一數位浮點數向位數更小的第二數位浮點數的轉換過程;
將所述暫存數據轉換為多個以第二數位浮點數表示的模型數據;
對所述以第二數位浮點數表示的模型數據進行上采樣處理,得到多個以第一數位浮點數表示的還原數據;
通過在所述指定的繪圖協議下利用所述還原數據進行計算,執行所述人工智能模型的推理過程。
2.根據權利要求1所述的方法,所述融合處理,具體包括:
對所述多個以第一數位浮點數表示的模型數據進行降采樣處理,以使所述第一數位浮點數對應轉換第二數位浮點數;
將所述降采樣處理后得到的多個第二數位浮點數合并為一個以第一數位浮點數表示的模型數據,作為所述暫存數據。
3.根據權利要求2所述的方法,所述將所述降采樣處理后得到的多個第二數位浮點數合并為一個以第一數位浮點數表示的模型數據,作為所述暫存數據,具體包括:
將所述降采樣處理后得到的多個第二數位浮點數打包為一個以關鍵操作支持的指定數據類型表示的模型數據,作為第一中轉數據,所述關鍵操作是根據指定的浮點數位轉換算法確定的,所述關鍵操作不支持浮點數據類型;
利用所述預定浮點數位轉換算法,通過針對所述第一中轉數據執行所述關鍵操作,得到以第一數位浮點數表示的模型數據,作為所述暫存數據。
4.根據權利要求3所述的方法,所述將所述暫存數據轉換為多個以第二數位浮點數表示的模型數據,具體包括:
將所述暫存數據轉化為以關鍵操作支持的指定數據類型表示的模型數據,作為第二中轉數據;
將所述第二中轉數據拆分為多個以第二數位浮點數表示的模型數據。
5.根據權利要求3所述的方法,所述將所述降采樣處理后得到的多個第二數位浮點數打包為一個以關鍵操作支持的指定數據類型表示的模型數據,具體包括:
根據所述降采樣處理后得到的多個第二數位浮點數的階碼和尾數,對所述多個第二數位浮點數進行拼接處理,得到一個以關鍵操作支持的指定數據類型表示的模型數據。
6.根據權利要求1所述的方法,所述通過在所述指定的繪圖協議下利用所述還原數據進行計算,執行所述人工智能模型的推理過程,具體包括:
根據所述還原數據,對應地確定所述人工智能模型的推理過程所需執行的矩陣運算;
根據所述指定的繪圖協議,為所述還原數據生成中間圖像,并通過對所述中間圖像進行圖像處理,執行所述矩陣運算以完成所述推理過程。
7.根據權利要求3或4所述的方法,所述關鍵操作包括位運算。
8.根據權利要求3或4所述的方法,所述第一數位為32位,所述第二數位為16位,所述指定數據類型為32位的整型。
9.根據權利要求1~6任一項所述的方法,所述指定的繪圖協議為webGL;
所述多個以第一數位浮點數表示的模型數據是通過webGL提供的接口上傳至GPU,以便在所述GPU中進行所述融合處理。
10.根據權利要求1~6任一項所述的方法,應用于端智能引擎,所述端智能引擎用于在用戶終端上執行所述人工智能模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110995308.4/1.html,轉載請聲明來源鉆瓜專利網。





