<abbr id="kc8ii"><menu id="kc8ii"></menu></abbr>
  • <input id="kc8ii"><tbody id="kc8ii"></tbody></input><table id="kc8ii"><source id="kc8ii"></source></table><kbd id="kc8ii"></kbd>
    <center id="kc8ii"><table id="kc8ii"></table></center>
  • <input id="kc8ii"></input>
    <abbr id="kc8ii"></abbr>
  • <abbr id="kc8ii"></abbr>
  • <center id="kc8ii"><table id="kc8ii"></table></center>
    <abbr id="kc8ii"></abbr>
    你的位置:首頁(yè) > 測(cè)試測(cè)量 > 正文

    在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)

    發(fā)布時(shí)間:2020-09-02 來(lái)源:黃侖,Achronix資深現(xiàn)場(chǎng)應(yīng)用工程師 責(zé)任編輯:wenwei

    【導(dǎo)讀】日益增長(zhǎng)的數(shù)據(jù)加速需求對(duì)硬件平臺(tái)提出了越來(lái)越高的要求,F(xiàn)PGA作為一種可編程可定制化的高性能硬件發(fā)揮著越來(lái)越重要的作用。近年來(lái),高端FPGA芯片采用了越來(lái)越多的Hard IP去提升FPGA外圍的數(shù)據(jù)傳輸帶寬以及存儲(chǔ)器帶寬。但是在FPGA內(nèi)部,可編程邏輯部分隨著工藝提升而不斷進(jìn)步的同時(shí),內(nèi)外部數(shù)據(jù)交換性能的提升并沒(méi)有那么明顯,所以FPGA內(nèi)部數(shù)據(jù)的交換越來(lái)越成為數(shù)據(jù)傳輸?shù)钠款i。
     
    為了解決這一問(wèn)題,Achronix 在其最新基于臺(tái)積電(TSMC)7nm FinFET工藝的Speedster7t FPGA器件中包含了革命性的創(chuàng)新型二維片上網(wǎng)絡(luò)(2D NoC)。這種2D NoC如同在FPGA可編程邏輯結(jié)構(gòu)之上運(yùn)行的高速公路網(wǎng)絡(luò)一樣,為FPGA外部高速接口和內(nèi)部可編程邏輯的數(shù)據(jù)傳輸提供了大約高達(dá)27Tbps的超高帶寬。
     
    作為Speedster7t FPGA器件中的重要?jiǎng)?chuàng)新之一,2D NoC為FPGA設(shè)計(jì)提供了幾項(xiàng)重要優(yōu)勢(shì),包括:
     
    ●   提高設(shè)計(jì)的性能,讓FPGA內(nèi)部的數(shù)據(jù)傳輸不再成為瓶頸。
    ●   節(jié)省FPGA可編程邏輯資源,簡(jiǎn)化邏輯設(shè)計(jì),由NoC去替代傳統(tǒng)的邏輯去做高速數(shù)據(jù)傳輸和數(shù)據(jù)總線管理。
    ●   增加了FPGA的布線資源,對(duì)于資源占用很高的設(shè)計(jì)有效地降低布局布線擁塞的風(fēng)險(xiǎn)。
    ●   實(shí)現(xiàn)真正的模塊化設(shè)計(jì),減小FPGA設(shè)計(jì)人員調(diào)試的工作量。
     
    本文用了一個(gè)具體的FPGA設(shè)計(jì)案例,來(lái)體現(xiàn)上面提到的NoC在FPGA設(shè)計(jì)中的幾項(xiàng)重要作用。這個(gè)設(shè)計(jì)的主要目的是展示FPGA內(nèi)部的邏輯如何去訪問(wèn)片外的存儲(chǔ)器。如圖1所示,本設(shè)計(jì)包含8個(gè)讀寫模塊,這8個(gè)讀寫模塊需要訪問(wèn)8個(gè)GDDR6通道,這樣就需要一個(gè)8x8的AXI interconnect模塊,同時(shí)需要有跨時(shí)鐘域的邏輯去將每個(gè)GDDR6用戶接口時(shí)鐘轉(zhuǎn)換到邏輯主時(shí)鐘。除了圖1中的8個(gè)讀寫模塊外,紅色區(qū)域的邏輯都需要用FPGA的可編程邏輯去實(shí)現(xiàn)。
     
    在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)
    圖1 傳統(tǒng)FPGA實(shí)現(xiàn)架構(gòu)
     
    對(duì)于AXI interconnect模塊,我們采用Github上開源的AXI4總線連接器來(lái)實(shí)現(xiàn),這個(gè)AXI4總線連接器將4個(gè)AXI4總線主設(shè)備連接到8個(gè)AXI4總線從設(shè)備,源代碼可以在參考文獻(xiàn)2的鏈接中下載。我們?cè)谶@個(gè)代碼的基礎(chǔ)上進(jìn)行擴(kuò)展,增加到8個(gè)AXI4總線主設(shè)備連接到8個(gè)AXI4總線從設(shè)備,同時(shí)加上了跨時(shí)鐘域邏輯。
     
    為了進(jìn)行對(duì)比,我們用另外一個(gè)設(shè)計(jì),目的還是用這8個(gè)讀寫模塊去訪問(wèn)8個(gè)GDDR6通道;不同的是,這次我們將8個(gè)讀寫模塊連接到Achronix的Speedster7t FPGA器件的2D NoC上,然后通過(guò)2D NoC去訪問(wèn)8個(gè)GDDR6通道。如圖2所示:
     
    在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)
     圖2 Speedster7t 1500的實(shí)現(xiàn)架構(gòu) 
     
    首先,我們從資源和性能上做一個(gè)對(duì)比,如圖3所示:
     
    在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)
    圖3 資源占用和性能對(duì)比
     
    從資源占用上看,用AXI總線連接器的設(shè)計(jì)會(huì)比用2D NoC的設(shè)計(jì)占用多出很多的資源,以實(shí)現(xiàn)AXI interconnect還有跨時(shí)鐘域的邏輯。這里還要說(shuō)明一點(diǎn),這個(gè)開源的AXI interconnect實(shí)現(xiàn)的是一種最簡(jiǎn)單的總線連接器,并不支持2D NoC所能提供的所有功能,比如地址表映射,優(yōu)先級(jí)配置。
     
    最重要的一點(diǎn)是AXI interconnect只支持阻塞訪問(wèn)(blocking),不支持非阻塞訪問(wèn)(non-blocking)。阻塞訪問(wèn)是指發(fā)起讀或者寫請(qǐng)求以后,要等到本次讀或者寫操作完成以后,才能發(fā)起下一次的讀或者寫請(qǐng)求。而非阻塞訪問(wèn)是指可以連續(xù)發(fā)起讀或者寫請(qǐng)求,而不用等待上次的讀或者寫操作完成。在提高GDDR6的訪問(wèn)效率上面,阻塞訪問(wèn)會(huì)讓讀寫效率大大下降。
     
    如果用FPGA的可編程邏輯去實(shí)現(xiàn)完整的2D NoC功能,包括64個(gè)接入點(diǎn)、128bit位寬和400MHz的速率,大概需要850 k LE,等效于占用了Speedster7t 1500 FPGA器件56%的可編程資源。而2D NoC則可以提供 80個(gè)接入點(diǎn)、256bit位寬和2GHz速率,而且不占用FPGA可編程邏輯。
     
    從性能上來(lái)看,使用AXI總線連接器的設(shè)計(jì)只能跑到157MHz,而使用NoC的設(shè)計(jì)則能跑到500MHz。如果我們看一下設(shè)計(jì)后端的布局布線圖,就會(huì)有更深刻的認(rèn)識(shí)。圖4所示的是使用AXI總線連接器的設(shè)計(jì)后端布局布線圖。
     
    在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)
    圖4 使用AXI interconnect的設(shè)計(jì)后端布局布線圖
     
    從圖中可以看到,因?yàn)镚DDR6控制器分布在器件的兩側(cè)(圖中彩色高亮的部分),所以AXI總線連接器的布局基本分布在器件的中間,既不能靠近左邊,也不能靠近右邊,所以這樣就導(dǎo)致了性能上不去。如果增加pipeline的寄存器可以提高系統(tǒng)的性能,但是這樣會(huì)占用大量的寄存器資源,同時(shí)會(huì)給GDDR的訪問(wèn)帶來(lái)很大的延時(shí)。
     
    如果再看一下圖5中使用了2D NoC的布局布線圖,就會(huì)有很明顯的對(duì)比。首先,因?yàn)橛?D NoC實(shí)現(xiàn)了AXI總線連接器和跨時(shí)鐘域的模塊,這就節(jié)省了大量的資源;另外,因?yàn)?D NoC遍布在整個(gè)器件上,一共有80個(gè)接入點(diǎn),所以8個(gè)讀寫模塊可以由工具放置在器件的任何地方,而不影響設(shè)計(jì)的性能。
     
    在FPGA設(shè)計(jì)中如何充分利用NoC資源去支撐創(chuàng)新應(yīng)用設(shè)計(jì)
    圖5 使用2D NoC設(shè)計(jì)的后端布局布線圖
     
    從本設(shè)計(jì)的整個(gè)流程來(lái)看,使用2D NoC會(huì)極大的簡(jiǎn)化設(shè)計(jì),提高性能,同時(shí)節(jié)省大量的資源;FPGA設(shè)計(jì)工程師可以花更多的精力在核心模塊或者算法模塊設(shè)計(jì)上面,把總線傳輸、外部接口訪問(wèn)仲裁和接口異步時(shí)鐘域的轉(zhuǎn)換等工作全部交給2D NoC吧。
     
    如需了解更多Speedster7t FPGA器件產(chǎn)品細(xì)節(jié),請(qǐng)發(fā)送郵件到Dawson.Guo@Achronix.com,或訪問(wèn)Achronix公司官方網(wǎng)站:http://www.achronix.com以訂閱新聞和獲取產(chǎn)品資料。
     
    參考文獻(xiàn):
     
    1.使用帶有片上高速網(wǎng)絡(luò)的FPGA的八大好處
     
    2.https://github.com/Verdvana/AXI4_Interconnect
     
     
    推薦閱讀:
     
    貿(mào)澤贊助的電動(dòng)方程式賽車隊(duì)全力備賽為期9天的柏林之戰(zhàn)
    雷達(dá):汽車的虛擬眼
    超低功耗傳感器方案如何賦能智能、安全聯(lián)接的樓宇
    滿足超低EMI,還得看這個(gè)穩(wěn)壓器
    優(yōu)化隔離傳感器接口的功率轉(zhuǎn)換
    要采購(gòu)連接器么,點(diǎn)這里了解一下價(jià)格!
    特別推薦
    技術(shù)文章更多>>
    技術(shù)白皮書下載更多>>
    熱門搜索
    ?

    關(guān)閉

    ?

    關(guān)閉

    黄A无码片内射无码视频| 99高清中文字幕在线 | 人妻系列AV无码专区| 免费无码AV一区二区| 亚洲精品午夜无码电影网| 久久亚洲中文字幕精品一区四 | 亚洲国产av无码精品| 日韩亚洲AV无码一区二区不卡 | 国产激情无码视频在线播放性色| 中文字幕久久亚洲一区| 久久精品中文闷骚内射| 无码人妻少妇久久中文字幕| 精品日韩亚洲AV无码一区二区三区| 丝袜无码一区二区三区| 亚洲中文字幕成人在线| 久久男人中文字幕资源站| 欧美中文在线视频| 亚洲中文字幕无码久久2017| 久99久无码精品视频免费播放| 久久久久亚洲Av无码专| 无码人妻久久一区二区三区免费丨| 最近更新免费中文字幕大全| 精品久久久久久久久久中文字幕 | 天堂中文在线最新版| 中文字幕无码不卡在线| 无码国模国产在线无码精品国产自在久国产 | 亚洲午夜福利精品无码| 国产啪亚洲国产精品无码| 成年无码av片在线| h无码动漫在线观看| 国产精品毛片无码| 久久久精品无码专区不卡| 久久精品无码免费不卡| 亚洲AV永久无码精品一区二区 | 亚洲免费无码在线| 中文在线资源天堂WWW| 无码中文字幕乱在线观看| 亚洲中文字幕无码一久久区| 日本精品中文字幕| 日本一区二区三区中文字幕 | 小13箩利洗澡无码视频网站|