日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于x86架構的稠密矩陣乘法匯編代碼自動生成方法有效

專利信息
申請號: 201210199706.6 申請日: 2012-06-14
公開(公告)號: CN102750150A 公開(公告)日: 2012-10-24
發明(設計)人: 王茜;張先軼;張云泉 申請(專利權)人: 中國科學院軟件研究所
主分類號: G06F9/44 分類號: G06F9/44;G06F17/16
代理公司: 北京君尚知識產權代理事務所(普通合伙) 11200 代理人: 余長江
地址: 100190 *** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 x86 架構 稠密 矩陣 乘法 匯編 代碼 自動 生成 方法
【說明書】:

技術領域

本發明涉及計算機系統應用技術領域。具體涉及一種面向x86體系架構實現的稠密矩陣乘法函數的匯編代碼自動生成方法。

背景技術

代碼自動生成方法已成為目前的一研究方向,許多應用領域都采用代碼自動生成方法來降低開發周期,提高開發效率,比如專利ZL?200610152345.4,一種基于ASN類型對象的代碼生成方法。

稠密矩陣乘法是基礎線性子程序庫(BLAS)中三級函數之一。它廣泛應用于高性能計算領域,LINPACK測試結果嚴重依賴于稠密矩陣乘法函數的性能。BLAS三級中其余函數均可通過轉換為稠密矩陣乘法來實現。許多CPU廠商自主研發了針對他們自己處理器系統架構特征的高性能基礎線性代數子程序庫,如Intel?MKL和AMD?ACML。

美國德克薩斯大學奧斯汀分校超級計算中心高性能計算組開發的基礎線性代數子程序庫(GotoBLAS)通過手工編寫匯編代碼實現稠密矩陣乘法函數。其性能與CPU廠商自主研發的基礎線程代數子程序庫(MKL,ACML)相當,但由于其(GotoBLAS)采用手工編寫匯編代碼來實現高效的矩陣乘法運算,這將導致稠密矩陣乘法函數的性能與處理器硬件結構特征聯系緊密,比如高速緩存、物理寄存器、算術運算部件等。這些針對處理器硬件資源的優化方法往往具有平臺特殊性,即針對某個特定處理器平臺硬件資源種類和數量優化的稠密矩陣乘法匯編代碼,往往能夠在這個處理器平臺上獲得最優性能效果,但是當移植到另一臺具有不同硬件資源的處理器平臺上時,往往會出現程序性能下降的問題。GotoBLAS采取在不同的處理器上手工編寫不同的稠密矩陣匯編代碼來解決它在不同處理器平臺間的可移植性問題。這是一種低效的代碼開發方式,而且由于匯編代碼的可讀性比較差,代碼的維護工作也需要領域專家來完成。

美國田納西大學創新計算機實驗室開發的自動調優線性代數軟件(ATLAS)采用“軟件的自動經驗優化(AEOS)”方法,為給定的處理器“自動”選定最優的稠密矩陣實現方法。由于ATLAS生成的代碼依賴底層編譯器編譯時實施的寄存器分配優化技術和指令調度優化技術,這兩種優化技術往往對稠密矩陣乘法性能有巨大的影響。通用的底層編譯器,如gcc,提供的優化技術往往需要適用于所有應用,因而不能像領域專家手工調優匯編代碼一樣,針對稠密矩陣乘法的算法特點充分利用物理寄存器資源和算術運算部件資源。因此,雖然ATLAS解決了稠密矩陣乘法函數開發周期長,可移植性差的問題,但是它生成的代碼性能往往與手工優化編寫的基礎線性代數子程序庫GotoBLAS以及CPU生產商自主研發的基礎線性代數子程序庫MKL,ACML存在5%~10%的性能差距。

發明內容

針對現有技術中手工編寫稠密矩陣乘法函數的匯編代碼開發效率低、可移植性差;和已有的自動調優矩陣乘法函數技術依賴底層編譯器優化技術、性能低的缺點,本發明的目的在于提供一種基于x86架構的稠密矩陣乘法匯編代碼生成方法,可針對不同x86處理器平臺硬件資源的種類和數量自動生成稠密矩陣乘法函數的匯編代碼。為降低底層編譯器對生成代碼性能的影響,本發明將傳統編譯器使用的優化技術:寄存器分配和指令調度,從編譯器中“分離”出來,針對稠密矩陣乘法函數運算特點做出改進并給出實現,然后作用于本發明生成的匯編代碼。

本發明解決的稠密矩陣乘法計算形式為:C=A*B+C。在后續說明內容中,A和B為源操作矩陣,C為結果矩陣,其中矩陣A的大小表示為M*K,矩陣B的大小表示為K*N,矩陣C的大小表示為M*N。本發明采用的技術方案如下:

1)將矩陣A和B劃分為較小的矩陣進行計算。首先將矩陣A按Mc*Kc的大小劃分為多個子塊,將矩陣B按Kc*Nc的大小劃分為多個子塊。然后逐次將每個子塊矩陣AMc*Kc拷貝到連續的地址空間中,將每個子塊矩陣BKc*Nc拷貝至連續的地址空間中。本發明主要解決將子塊矩陣乘法的計算過程變為匯編代碼實現問題,該子塊矩陣乘法計算順序采用通用的j-i-k迭代順序,其中k為最內層迭代,j為最外層迭代。

2)利用已有代碼生成工具(POET),將1)中描述的子塊矩陣乘法計算過程翻譯為x86處理器支持的匯編代碼。其中POET是一個可將源程序語言編寫的代碼根據翻譯規則產生用戶自定義程序語言類型代碼的工具,源程序語言可以是C或者Fortran等。在本發明中,POET只作為一個代碼翻譯器工具,就像開發C程序使用的vc編輯器環境一樣?!白儞Q操作規則說明”在本發明中為開發人員根據通用優化技術實現的程序函數,本發明使用的變換操作包含:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院軟件研究所,未經中國科學院軟件研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210199706.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品一二三在线观看| 亚洲欧美日韩综合在线| 久久久精品观看| 国产精品欧美一区二区三区| 欧美极品少妇| 97视频久久久| 999亚洲国产精| 国产欧美一区二区三区在线| 91av中文字幕| 久久综合国产精品| 国产精品v欧美精品v日韩精品v | 亚洲欧美中日精品高清一区二区 | 国产91丝袜在线播放动漫| 欧美一区二区三区激情在线视频| 亚洲欧美另类久久久精品2019| 久久精品国产亚| 久久久人成影片免费观看| 91片在线观看| 亚洲精品卡一| 精品99免费视频| 亚洲国产精品91| 国产vsv精品一区二区62| 躁躁躁日日躁网站| 日本一区免费视频| 91久久精品国产91久久性色tv| 日韩午夜毛片| 91精品高清| 午夜老司机电影| **毛片免费| 国产伦理一区| 岛国黄色av| 亚洲国产一二区| 亚洲国产精品日本| 午夜爱爱电影| 亚洲一区精品视频| 国产乱人乱精一区二视频国产精品| 国产精品综合在线观看| 91麻豆精品国产91久久| 国产视频一区二区在线| 一区二区在线不卡| 中文字幕在线播放一区| 乱淫免费视频| 欧美一区二区三区久久精品视 | 国产精品白浆一区二区| 亚洲国产欧美国产综合一区| 91久久国产露脸精品国产| 国产视频一区二区在线| 久久国产精彩视频| 99久久婷婷国产精品综合| 久久99久国产精品黄毛片入口| 91一区二区三区在线| 天干天干天啪啪夜爽爽99| 亚洲国产另类久久久精品性| 91精品久久天干天天天按摩| 一区二区三区欧美在线| 国产色99| 国产一区二区三级| 91国产在线看| 国产视频在线一区二区| 夜夜精品视频一区二区| 猛男大粗猛爽h男人味| 国产高清在线精品一区二区三区| 国产黄色一区二区三区| 欧美日韩激情一区二区| 综合在线一区| 亚洲va久久久噜噜噜久久0| 年轻bbwbbw高潮| 91九色精品| 91一区二区三区久久国产乱| 精品国产乱码久久久久久虫虫| 国产精品第56页| 国产精品刺激对白麻豆99| 久久午夜鲁丝片| 久久精品国产亚洲一区二区| 日本少妇高潮xxxxⅹ| 国产日产高清欧美一区二区三区| 在线国产一区二区三区| 午夜三级电影院| 国产精品一区一区三区| 中文字幕一二三四五区| 国产一区二区三区久久久| 亚洲国产偷| 欧美日韩激情一区二区| 国产在线精品一区| 日本一区二区三区四区高清视频| 国产日韩欧美一区二区在线观看 | 97人人澡人人添人人爽超碰| 国产高清精品一区| 99久久婷婷国产综合精品电影| 91片在线观看| 午夜免费片| 国产suv精品一区二区4| 久久久一二区| 亚洲精品日韩精品| 国产精品久久人人做人人爽| 日韩精品一区二区三区四区在线观看 | av不卡一区二区三区| 狠狠色狠狠色很很综合很久久| 国产日韩精品久久| 欧美日韩国产一二| 久久精品视频3| 欧美精品免费一区二区三区 | 制服丝袜二区| 国产精品久久久久久久久久久久久久不卡 | 国产97久久| 扒丝袜网www午夜一区二区三区| 国产精品一区二区免费| 国产亚洲精品久久777777| 国产精品9区| 午夜色影院| 国产精品日韩一区二区| 中文字幕精品一区二区三区在线| 午夜剧场一区| 亚洲精品中文字幕乱码三区91| 欧美精品五区| 亚洲乱子伦| 精品国产乱码久久久久久久久 | 热re99久久精品国99热蜜月| 国产91色综合| 99精品视频一区二区| 久99久精品| 精品国产一级| 国产精品亚洲а∨天堂123bt| 欧美高清xxxxx| 国产一区二区在线免费| 日韩av不卡一区| 99精品欧美一区二区| 综合欧美一区二区三区| 99精品欧美一区二区三区美图| 国产午夜一区二区三区| 99久久久国产精品免费无卡顿| 91麻豆精品国产91久久久更新资源速度超快| 国产69精品福利视频| 国产乱码一区二区三区| 国产在线拍偷自揄拍视频| 久久久久久久亚洲视频| 国产91精品一区二区麻豆亚洲| 精品三级一区二区| 国产精品久久久久激情影院| 欧美精品一区久久| 国产一区午夜| 精品久久不卡| 欧美一区二区三区四区在线观看| 片毛片免费看| 欧美日韩一区二区三区四区五区| 精品在线观看一区二区| 国产精品刺激对白麻豆99| 午夜一级电影| 国产精品69久久久| 玖玖玖国产精品| 夜夜爱av| 日韩亚洲国产精品| 国产aⅴ一区二区| 伊人av综合网| 91久久国语露脸精品国产高跟| 视频国产一区二区| 亚洲精品人| 99精品欧美一区二区三区美图| 国产亚洲精品久久久久久久久动漫| 26uuu亚洲电影在线观看| 久久久精品观看| freexxxxxxx| 福利片一区二区三区| 亚洲精品国产精品国产| 久久一区二区三区欧美| 国产一区二区片| 窝窝午夜精品一区二区| 挺进警察美妇后菊| 国产精品尤物麻豆一区二区三区| 国产69精品久久99不卡免费版| 国产一区日韩欧美| 亚洲欧洲日韩在线| 国产偷自视频区视频一区二区| 淫片免费看| 国产日产高清欧美一区二区三区| 中文在线一区二区三区| av素人在线| 91麻豆精品国产自产欧美一级在线观看| 国产91视频一区二区| 国产一二区在线| 91一区二区三区在线| 欧美在线观看视频一区二区| 午夜大片男女免费观看爽爽爽尤物| 国产精品香蕉在线的人| 免费观看黄色毛片| 国产精品一区不卡| 国产精品免费一视频区二区三区| 日韩一区国产| 欧美乱码精品一区二区 | 国产一区二区三区中文字幕| 欧美三区视频| 99久久婷婷国产综合精品电影| 国产精品视频一区二区三| 波多野结衣巨乳女教师| 91精品久久久久久| 狠狠色噜噜狼狼狼色综合久| 欧美日韩国产在线一区| 国产高潮国产高潮久久久91| 国产农村乱色xxxx| 国产999精品视频| 欧美日韩一区二区三区在线观看视频 | 淫片免费看| 国模一区二区三区白浆| 久久国产精品视频一区| 欧美激情片一区二区| 亚洲精品一区二区另类图片| 粉嫩久久99精品久久久久久夜| 狠狠色噜噜狠狠狠色综合| 一本大道久久a久久精品| 久久国产免费视频| 国产精品久久久久久亚洲调教| 亚洲欧美日韩综合在线| 国产视频一区二区不卡| 国产aⅴ精品久久久久久| 91国偷自产一区二区介绍| 久久人人精品| 狠狠躁夜夜av| 亚洲国产一区二区精品| 少妇高潮大叫喷水| 国产日韩欧美精品| 欧美日韩激情在线| 国产精品96久久久| 超碰97国产精品人人cao| 97久久国产精品| 日韩国产不卡| 免费观看xxxx9999片| 久久艹亚洲| 狠狠色噜噜狠狠狠狠88| 亚洲精品一区在线| 玖玖爱国产精品| 国产三级在线视频一区二区三区| 日韩久久精品一区二区| 国产精品1区2区| 日韩午夜一区| 欧美精选一区二区三区| 狠狠色成色综合网| 国产精品偷乱一区二区三区| 免费毛片a| 国产精彩视频一区二区| 久久99精品国产一区二区三区| 国产亚洲欧美日韩电影网| 国产精品视频久久久久久| 精品国产免费一区二区三区| 精品国产18久久久久久依依影院| 欧美一区二区三区片| 亚洲乱玛2021|