日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于x86架構的稠密矩陣乘法匯編代碼自動生成方法有效

專利信息
申請號: 201210199706.6 申請日: 2012-06-14
公開(公告)號: CN102750150A 公開(公告)日: 2012-10-24
發明(設計)人: 王茜;張先軼;張云泉 申請(專利權)人: 中國科學院軟件研究所
主分類號: G06F9/44 分類號: G06F9/44;G06F17/16
代理公司: 北京君尚知識產權代理事務所(普通合伙) 11200 代理人: 余長江
地址: 100190 *** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 x86 架構 稠密 矩陣 乘法 匯編 代碼 自動 生成 方法
【說明書】:

技術領域

本發明涉及計算機系統應用技術領域。具體涉及一種面向x86體系架構實現的稠密矩陣乘法函數的匯編代碼自動生成方法。

背景技術

代碼自動生成方法已成為目前的一研究方向,許多應用領域都采用代碼自動生成方法來降低開發周期,提高開發效率,比如專利ZL?200610152345.4,一種基于ASN類型對象的代碼生成方法。

稠密矩陣乘法是基礎線性子程序庫(BLAS)中三級函數之一。它廣泛應用于高性能計算領域,LINPACK測試結果嚴重依賴于稠密矩陣乘法函數的性能。BLAS三級中其余函數均可通過轉換為稠密矩陣乘法來實現。許多CPU廠商自主研發了針對他們自己處理器系統架構特征的高性能基礎線性代數子程序庫,如Intel?MKL和AMD?ACML。

美國德克薩斯大學奧斯汀分校超級計算中心高性能計算組開發的基礎線性代數子程序庫(GotoBLAS)通過手工編寫匯編代碼實現稠密矩陣乘法函數。其性能與CPU廠商自主研發的基礎線程代數子程序庫(MKL,ACML)相當,但由于其(GotoBLAS)采用手工編寫匯編代碼來實現高效的矩陣乘法運算,這將導致稠密矩陣乘法函數的性能與處理器硬件結構特征聯系緊密,比如高速緩存、物理寄存器、算術運算部件等。這些針對處理器硬件資源的優化方法往往具有平臺特殊性,即針對某個特定處理器平臺硬件資源種類和數量優化的稠密矩陣乘法匯編代碼,往往能夠在這個處理器平臺上獲得最優性能效果,但是當移植到另一臺具有不同硬件資源的處理器平臺上時,往往會出現程序性能下降的問題。GotoBLAS采取在不同的處理器上手工編寫不同的稠密矩陣匯編代碼來解決它在不同處理器平臺間的可移植性問題。這是一種低效的代碼開發方式,而且由于匯編代碼的可讀性比較差,代碼的維護工作也需要領域專家來完成。

美國田納西大學創新計算機實驗室開發的自動調優線性代數軟件(ATLAS)采用“軟件的自動經驗優化(AEOS)”方法,為給定的處理器“自動”選定最優的稠密矩陣實現方法。由于ATLAS生成的代碼依賴底層編譯器編譯時實施的寄存器分配優化技術和指令調度優化技術,這兩種優化技術往往對稠密矩陣乘法性能有巨大的影響。通用的底層編譯器,如gcc,提供的優化技術往往需要適用于所有應用,因而不能像領域專家手工調優匯編代碼一樣,針對稠密矩陣乘法的算法特點充分利用物理寄存器資源和算術運算部件資源。因此,雖然ATLAS解決了稠密矩陣乘法函數開發周期長,可移植性差的問題,但是它生成的代碼性能往往與手工優化編寫的基礎線性代數子程序庫GotoBLAS以及CPU生產商自主研發的基礎線性代數子程序庫MKL,ACML存在5%~10%的性能差距。

發明內容

針對現有技術中手工編寫稠密矩陣乘法函數的匯編代碼開發效率低、可移植性差;和已有的自動調優矩陣乘法函數技術依賴底層編譯器優化技術、性能低的缺點,本發明的目的在于提供一種基于x86架構的稠密矩陣乘法匯編代碼生成方法,可針對不同x86處理器平臺硬件資源的種類和數量自動生成稠密矩陣乘法函數的匯編代碼。為降低底層編譯器對生成代碼性能的影響,本發明將傳統編譯器使用的優化技術:寄存器分配和指令調度,從編譯器中“分離”出來,針對稠密矩陣乘法函數運算特點做出改進并給出實現,然后作用于本發明生成的匯編代碼。

本發明解決的稠密矩陣乘法計算形式為:C=A*B+C。在后續說明內容中,A和B為源操作矩陣,C為結果矩陣,其中矩陣A的大小表示為M*K,矩陣B的大小表示為K*N,矩陣C的大小表示為M*N。本發明采用的技術方案如下:

1)將矩陣A和B劃分為較小的矩陣進行計算。首先將矩陣A按Mc*Kc的大小劃分為多個子塊,將矩陣B按Kc*Nc的大小劃分為多個子塊。然后逐次將每個子塊矩陣AMc*Kc拷貝到連續的地址空間中,將每個子塊矩陣BKc*Nc拷貝至連續的地址空間中。本發明主要解決將子塊矩陣乘法的計算過程變為匯編代碼實現問題,該子塊矩陣乘法計算順序采用通用的j-i-k迭代順序,其中k為最內層迭代,j為最外層迭代。

2)利用已有代碼生成工具(POET),將1)中描述的子塊矩陣乘法計算過程翻譯為x86處理器支持的匯編代碼。其中POET是一個可將源程序語言編寫的代碼根據翻譯規則產生用戶自定義程序語言類型代碼的工具,源程序語言可以是C或者Fortran等。在本發明中,POET只作為一個代碼翻譯器工具,就像開發C程序使用的vc編輯器環境一樣。“變換操作規則說明”在本發明中為開發人員根據通用優化技術實現的程序函數,本發明使用的變換操作包含:

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院軟件研究所,未經中國科學院軟件研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210199706.6/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产一区二区视频播放| 中文字幕一区2区3区| 欧美日韩国产精品综合| 视频国产一区二区| 国产日韩欧美91| 96国产精品视频| 亚洲高清久久久| 91亚洲欧美日韩精品久久奇米色 | 国产91福利视频| 色乱码一区二区三在线看| 久久久999精品视频| 免费观看黄色毛片| 国产91九色在线播放| 91麻豆精品国产91久久久资源速度| 午夜一区二区三区在线观看| 久久久精品免费看| 欧美高清极品videossex| 91精品一区二区在线观看 | 免费久久99精品国产婷婷六月 | 国产日韩一二三区| 美女啪啪网站又黄又免费| 制服丝袜二区| 91看黄网站| 四虎国产精品永久在线| 精品久久久综合| 91精品色| 欧美精品在线观看视频| 韩国女主播一区二区| 欧美3p激情一区二区三区猛视频| 中文字幕制服狠久久日韩二区| 日本一区二区免费电影| 国产一区在线免费观看| 亚洲精品久久久久999中文字幕 | 2020国产精品自拍| 国产网站一区二区| 亚洲精品乱码久久久久久写真| 91福利视频免费观看| 91精品第一页| 天天射欧美| 国产一区二区电影在线观看| 国产精选一区二区| 久久国产欧美日韩精品| 亚洲精品少妇久久久久| 四虎久久精品国产亚洲av| 久久亚洲精品国产日韩高潮| 国产全肉乱妇杂乱视频在线观看| 欧美精选一区二区三区| 欧美日韩久久一区二区| 国产精品美女久久久免费| 国产日产欧美一区| 综合久久一区二区三区| 高清人人天天夜夜曰狠狠狠狠| 99久精品视频| 午夜特级片| 日本少妇高潮xxxxⅹ| 欧美国产三区| 少妇精品久久久久www蜜月| 视频国产一区二区| 国内视频一区二区三区| 国产91白嫩清纯初高中在线| 日韩av在线影院| 欧美一区二区三区爽大粗免费 | 国产另类一区| 国产一区二区三区大片| 午夜激情电影院| 欧美综合在线一区| 国产精品天堂网| 视频国产一区二区| 国产精品1234区| 日韩在线一区视频| 91麻豆产精品久久久| 亚洲精品国产91| 日韩欧美国产中文字幕| 国产免费一区二区三区网站免费 | 欧美日韩一卡二卡| 欧美精品五区| 国产伦理久久精品久久久久| 麻豆精品久久久| 国产一级在线免费观看| 国产精品视频二区不卡| 国产偷国产偷亚洲清高| 欧美一区二区三区久久精品视| 欧美高清视频一区二区三区| 日韩精品乱码久久久久久| 亚洲va久久久噜噜噜久久0| 亚洲国产精品女主播| 国产欧美一区二区三区免费| 国产一区免费播放| 四虎国产永久在线精品| 国产精品999久久久| 清纯唯美经典一区二区| 91午夜在线| 亚洲一二三在线| 国产va亚洲va在线va| 国产精品久久久久久久久久久久久久久久久久 | 久久精品国产亚洲一区二区| 日韩欧美视频一区二区| 国产日韩欧美一区二区在线播放| 亚洲精品日本无v一区| 91精品一区| 国产精品乱战久久久| 国产精品免费自拍| 91片在线观看| 免费a级毛片18以上观看精品| 99久久精品国产系列| 国产日韩一二三区| 91福利视频导航| 精品免费久久久久久久苍| 欧美精品中文字幕在线观看| 国产精品久久国产精品99 | 亚洲日本国产精品| 美女脱免费看直播| 2023国产精品自产拍在线观看| 国产91丝袜在线播放动漫| 99精品久久99久久久久| 69精品久久| 国产品久精国精产拍| 亚洲国产精品国自产拍久久| 国产精品入口麻豆九色| 狠狠色噜噜狠狠狠狠88| 国产一区二区日韩| 午夜裸体性播放免费观看| 欧美日韩精品在线播放| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 男女午夜爽爽| 国产婷婷色一区二区三区在线| 国产欧美视频一区二区| 国产91在线拍偷自揄拍| 国内揄拍国产精品| 99国产精品九九视频免费看| 日韩精品一区二区中文字幕| 精品国产一区二区三区麻豆免费观看完整版 | 国产精品亚州| 午夜国内精品a一区二区桃色| 亚洲精品人| 欧美日韩激情一区二区| 欧美日韩精品在线一区二区| 日韩亚洲欧美一区| 日韩中文字幕在线一区二区| 亚洲午夜久久久久久久久电影院| 国产精品自产拍在线观看桃花| 99久久精品一区字幕狠狠婷婷| 亚洲欧美色图在线| 午夜影院h| 欧美一区二区三区国产精品| 香蕉久久国产| 精品一区二区三区自拍图片区| 四虎国产精品永久在线| 少妇高潮ⅴideosex| 99久久夜色精品国产网站| 一级女性全黄久久生活片免费| 午夜av片| 久久99久久99精品免观看软件 | 国产精品久久久久久久久久嫩草| 国产精品日本一区二区不卡视频| 亚洲国产偷| 99精品国产免费久久| 欧美一区二区三区久久久久久桃花 | 国产精品亚洲а∨天堂123bt| 日本一区二区欧美| 手机看片国产一区| 91精品一区二区在线观看 | 精品久久综合1区2区3区激情| 国产一区二区三区黄| 久久精品综合视频| 一级久久久| 99久久国产综合精品麻豆| 狠狠色狠狠色很很综合很久久| 精品久久久影院| 亚洲理论影院| 精品a在线| 日本伦精品一区二区三区免费| 亚洲色欲色欲www| 免费久久99精品国产婷婷六月| 久久影视一区二区| 中文字幕视频一区二区| 国产1区2区3区中文字幕| 亚洲欧美日本一区二区三区 | 色噜噜狠狠色综合影视| 欧美3p激情一区二区三区猛视频| 欧洲在线一区| 91麻豆精品国产综合久久久久久| 精品一区二区三区影院| 久久精品国产久精国产| 国产福利精品一区| 欧美久久久一区二区三区| 精品婷婷伊人一区三区三| 国产一区中文字幕在线观看| 国产伦高清一区二区三区| 国产欧美日韩一区二区三区四区| 亚洲欧美一卡| 久久久久国产精品免费免费搜索| 黄毛片免费| 欧美乱妇在线观看| 一区二区三区欧美在线| 亚洲国产精品综合| 国产一区第一页| 欧美日韩一区视频| 99精品一级欧美片免费播放 | 久久精品爱爱视频| 午夜大片男女免费观看爽爽爽尤物| 免费的午夜毛片| 国产精品欧美久久| 国产精品一区二区在线观看免费| 狠狠插狠狠爱| xxxx在线视频| 国产精品美女一区二区视频| 国产精品偷乱一区二区三区| 日本一区欧美| 97久久国产精品| 日本一二三区视频在线| 日日狠狠久久8888偷色| 91看黄网站| 国产色午夜婷婷一区二区三区| 国产精自产拍久久久久久蜜| 国产精品一区二区不卡| 在线观看欧美日韩国产| 91国产在线看| 97香蕉久久国产超碰青草软件| 国产91在| 中文字幕二区在线观看| 欧美3级在线| 精品国精品国产自在久不卡| 91av精品| 欧美精品在线观看视频| 国产69精品久久久久999小说| 日韩一区高清| 国产精品一区二区三区在线看| 国产一区二区视频播放| 久久99精品国产麻豆婷婷洗澡| 狠狠躁日日躁狂躁夜夜躁| 久久中文一区二区| 久久久综合亚洲91久久98| 久久噜噜少妇网站| 精品久久久综合| 国产精品69av| 欧美日韩一区二区三区不卡| 伊人欧美一区| 欧美在线一区二区视频| 日韩精品免费一区二区三区| 亚洲制服丝袜在线| 激情久久久| 国产精品三级久久久久久电影| 久久午夜鲁丝片午夜精品| 日本高清一二区| 97久久精品一区二区三区观看|