[發明專利]支持標量復用的非全流水向量除法開方裝置及方法有效
| 申請號: | 201010133813.X | 申請日: | 2010-03-25 |
| 公開(公告)號: | CN101840323A | 公開(公告)日: | 2010-09-22 |
| 發明(設計)人: | 劉宏偉;郇丹丹;張曉春 | 申請(專利權)人: | 北京龍芯中科技術服務中心有限公司 |
| 主分類號: | G06F7/535 | 分類號: | G06F7/535;G06F9/38 |
| 代理公司: | 北京市隆安律師事務所 11323 | 代理人: | 史霞 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 支持 標量 流水 向量 除法 開方 裝置 方法 | ||
技術領域
本發明涉及微處理器體系結構技術領域,并且具體涉及一種支持標量復用的非全流水向量除法開方裝置及方法。
背景技術
隨著處理器技術的不斷發展,其應用的領域也不斷拓展。尤其隨著多媒體運算,科學運算等各種運算的增加,各種通用處理器都在添加單指令流多數據流的指令集。這種單指令流多數據流的指令集的向量指令都會為有相應的標量指令,因為,并不是所有的程序都是可以向量化的。
這種向量化擴展,為增加其運算峰值,需要并行的增加其功能運算部件。如,一個有256位寬運算能力的功能部件,其64位的雙精度運算部件就需要四個。
大多數的運算常常是全流水的,所以其執行標量指令的時候,其未使用的其它運算部件不會產生浪費。而除法開方部件卻是非全流水的,并且其執行拍數不確定,所以其執行標量指令時若阻塞其它標量除法開方指令發射,就會形成對其它幾除法開方指令執行部件的浪費。
目前,國內外尚沒有發現支持標量復用的非全流水向量除法開方的相關技術。
發明內容
本發明目的在于提供一種支持標量復用的非全流水向量除法開方裝置及方法,在其執行標量指令時,仍可以發射其它的標量除法開方指令,從而可以大大增加除法開方部件的利用率。同時由于除法開方運算是非流水的,常常阻塞整個功能部件,這樣也增加了其除法運算能力,從而大大減少流水線的阻塞,提高了處理器的運行效率。
為實現本發明的目的而提供一種支持標量復用的非全流水向量除法開方裝置。該裝置包括控制模塊和至少兩個除法開方部件,其中控制模塊包括:選擇模塊,用于產生選擇信號以選擇輸入數據被送往哪個除法開方部件;標量和向量執行指令控制模塊,用于根據所述除法開方部件的“忙”信號來進行標量和向量執行指令的控制;數據通路選擇模塊,用于根據所述選擇信號來生成相應的通路;結果控制模塊:用于根據配置,實現不同數據格式的結果。
為實現本發明的目的還提供一種支持標量復用的非全流水向量除法開方方法。該方法包括以下步驟:S1:發射指令至控制模塊的指令發射步驟;S2:產生選擇信號以選擇輸入數據被送往哪個除法開方部件的選擇步驟;S3:根據所述除法開方部件的“忙”信號來進行標量和向量執行指令的控制的標量和向量執行指令控制步驟;S4:根據所述選擇信號來生成相應的通路的數據通路選擇步驟;S5:分配所述除法開方部件是否參加運算的分配步驟;S6:結果數據根據配置進行整理步驟。。
本發明的有益效果:在本發明的支持標量復用的非全流水向量除法開方裝置和方法中,對于標量指令復用其子功能部件的結構。這種結構,可以使其在保持基本的向量結構下,對標量除法開方指令進行子模塊的復用,也大大提高了功能部件的利用率,且其硬件代價不大。
附圖說明
圖1是依據本發明的一個具體實施例的支持標量復用的非全流水向量除法開方裝置的結構示意圖;
圖2是依據本發明的一個具體實施例的支持標量復用的非全流水向量除法開方方法的流程圖;
圖3是以向量運算為256位寬度時,單雙精度浮點結果的表示方式示意圖。
具體實施方式
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明的提高微處理器部件利用率和運算效率的裝置和方法進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明而不是對本發明的限制。
下面結合附圖和具體實施方式對本發明作進一步詳細描述。
圖1是依據本發明的一個具體實施例的支持標量復用的非全流水向量除法開方裝置的結構示意圖。在這里需要說明的是,附圖中的四個除法開方部件只是一種優選的實施方式,該部件可以為二個,三個,五個……,并且這些部件為相同的運算部件。
指令發射部件可以用于發射指令至控制模塊,該指令可以是一種指令碼。具體地,每周期一條指令被發射到功能部件,它的操作數是256位的。對于其中的標量指令,則高位處的192位是無效的。所以,數據通路為最低的64位是可以到達四個除法開方部件中的任意一個。至于到達其中的哪一個部件,由控制模塊生成的sel信號來控制。對于向量運算,其256位的操作數都是有意義的,所以每個64位的操作數都相應地傳送到相應的除法功能模塊中去。
而且,對于結果也有相應的選擇,只是通路方向反過來,從四個部件都要有到最低位的數據通路。結果的選擇信號res_control來控制。最終結果的高位可以做補零等操作。
在標量和向量指令執行控制中,控制模塊中有一個計數器,來統計四個模塊中忙的部件的數目。對于每周期發射得到指令,處理如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京龍芯中科技術服務中心有限公司,未經北京龍芯中科技術服務中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010133813.X/2.html,轉載請聲明來源鉆瓜專利網。





