如何采用fpga協(xié)處理器實現(xiàn)算法加速_第1頁
已閱讀1頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、如何采用如何采用FPGA協(xié)處理器實現(xiàn)算法加速協(xié)處理器實現(xiàn)算法加速當今的設計工程師受到面積、功率和成本的約束,不能采用GHz級的計算機實現(xiàn)嵌入式設計。在嵌入式系統(tǒng)中,通常是由相對數(shù)量較少的算法決定最大的運算需求。使用設計自動化工具可以將這些算法快速轉(zhuǎn)換到硬件協(xié)處理器中。然后,協(xié)處理器可以有效地連接到處理器,產(chǎn)生“GHz”級的性能。本文主要研究了代碼加速和代碼轉(zhuǎn)換到硬件協(xié)處理器的方法。我們還分析了通過一個涉及到基于輔助處理器單元(APU)的

2、實際圖像顯示案例的基準數(shù)據(jù)均衡決策的過程。該設計使用了在一個平臺FPGA中實現(xiàn)的一個嵌入式PowerPC。協(xié)處理器的意義協(xié)處理器的意義協(xié)處理器是一個處理單元,該處理單元與一個主處理單元一起使用來承擔通常由主處理單元執(zhí)行的運算。通常,協(xié)處理器功能在硬件中實現(xiàn)以替代幾種軟件指令。通過減少多種代碼指令為單一指令,以及在硬件中直接實現(xiàn)指令的方式,從而實現(xiàn)代碼加速。最常用的協(xié)處理器是浮點單元(FPU),這是與CPU緊密結(jié)合的唯一普通協(xié)處理器。沒有

3、通用的協(xié)處理器庫,即使是存在這樣的庫,將依然難以簡單地將協(xié)處理器與一個CPU(例如Pentium4)連接。XilinxVirtex4FXFPGA擁有一個或兩個PowerPC,每個都有一個APU接口。通過在FPGA中嵌入一個處理器,現(xiàn)在就有機會在單芯片上實現(xiàn)完整的處理系統(tǒng)。帶APU接口的PowerPC使得在FPGA中得以實現(xiàn)一個緊密結(jié)合的協(xié)處理器。因為頻率的需求以及管腳數(shù)量的限制,采用外部協(xié)處理器不大可行。因此可以創(chuàng)建一個直接連接到Pow

4、erPC的專用應用協(xié)處理器,大大地提高了軟件速度。因為FPGA是可編程的,你可以快速地開發(fā)和測試連接到CPU的協(xié)處理器解決方案。協(xié)處理器連接模型協(xié)處理器連接模型協(xié)處理器有三種基本的形式:與CPU總線連接的、與IO連接的和指令流水線連接(InstructionPipelineConnection)。此外,還存在一些這些形式的混合形式。1.CPU總線連接處理器總線連接加速器需要CPU在總線上移動數(shù)據(jù)以及發(fā)送命令。通常,單個數(shù)據(jù)處理就需要很多

5、的處理器時鐘周期。因為總線仲裁以及總線驅(qū)動的時鐘是處理器時鐘的分頻,所以會降低數(shù)據(jù)處理速度。一個與總線連接的加速器可FPGA作為一種可重復編程的單元,允許你在設計過程中進行編程并對其進行測試。如果你發(fā)現(xiàn)了一個設計缺陷,你可以立即對其進行重新編程設計。FPGA還允許你實現(xiàn)硬件運算功能,而這在以前的實現(xiàn)成本是很高的。CPU流水線與FPGA邏輯之間緊密結(jié)合,這樣就可以創(chuàng)建高性能軟件加速器。圖1的模塊框圖顯示了PowerPC、集成的APU控制器

6、以及一個與之相連的協(xié)處理器。來自高速緩存或存儲器中的指令可以立即出現(xiàn)在CPU解碼器和APU控制器上,如果CPU能識別指令,則運行這些指令。否則,APU控制器或用戶創(chuàng)建的協(xié)處理器可以對指令做出應答并執(zhí)行指令。一個或者兩個操作數(shù)被傳遞到協(xié)處理器,并返回一個結(jié)果或狀態(tài)。APU接口還支持用一個指令發(fā)送一個數(shù)據(jù)單元。數(shù)據(jù)單元的大小范圍從一個字節(jié)到4個32位的字。圖1:PowerPC、集成的APU控制器和協(xié)處理器通過一個結(jié)構(gòu)協(xié)處理器總線(FCB),

7、可以將一個或多個協(xié)處理器連接到APU接口。連接到總線的協(xié)處理器范圍包括現(xiàn)存的內(nèi)核(例如FPU)到用戶創(chuàng)建的協(xié)處理器。一個協(xié)處理器可以連接到FCB用于控制和狀態(tài)運算,并連接到一個處理器總線,實現(xiàn)直接存儲器數(shù)據(jù)塊訪問以及DMA數(shù)據(jù)傳遞。一種簡化的連接方案,例如FSL,也可以在FCB和協(xié)處理器之間使用,在犧牲一定性能的條件下實現(xiàn)FIFO數(shù)據(jù)和控制通信。為展示指令流水線連接加速器的性能優(yōu)勢,我們采用一個處理器總線連接FPU首先實現(xiàn)了一個設計,然

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論