SDRAM結(jié)構(gòu)、時序與性能的關(guān)系
一、影響性能的主要時序參數(shù)
所謂的影響性能是并不是指SDRAM的帶寬,頻率與位寬固定后,帶寬也就不可更改了。但這是理想的情況,在內(nèi)存的工作周期內(nèi),不可能總處于數(shù)據(jù)傳輸?shù)臓顟B(tài),因為要有命令、尋址等必要的過程。但這些操作占用的時間越短,內(nèi)存工作的效率越高,性能也就越好。
非數(shù)據(jù)傳輸時間的主要組成部分就是各種延遲與潛伏期。通過上文的講述,大家應(yīng)該很明顯看出有三個參數(shù)對內(nèi)存的性能影響至關(guān)重要,它們是tRCD、CL和tRP。每條正規(guī)的內(nèi)存模組都會在標(biāo)識上注明這三個參數(shù)值,可見它們對性能的敏感性。
以內(nèi)存最主要的操作--讀取為例。tRCD決定了行尋址(有效)至列尋址(讀/寫命令)之間的間隔,CL決定了列尋址到數(shù)據(jù)進行真正被讀取所花費的時間,tRP則決定了相同L-Bank中不同工作行轉(zhuǎn)換的速度,F(xiàn)在可以想象一下讀取時可能遇到的幾種情況(分析寫入操作時不用考慮CL即可):
1.要尋址的行與L-Bank是空閑的。也就是說該L-Bank的所有行是關(guān)閉的,此時可直接發(fā)送行有效命令,數(shù)據(jù)讀取前的總耗時為tRCD+CL,這種情況我們稱之為頁命中(PH,Page Hit)。
2.要尋址的行正好是前一個操作的工作行,也就是說要尋址的行已經(jīng)處于選通有效狀態(tài),此時可直接發(fā)送列尋址命令,數(shù)據(jù)讀取前的總耗時僅為CL,這就是所謂的背靠背(Back to Back)尋址,我們稱之為頁快速命中(PFH,Page Fast Hit)或頁直接命中(PDH,Page Direct Hit)。
3.要尋址的行所在的L-Bank中已經(jīng)有一個行處于活動狀態(tài)(未關(guān)閉),這種現(xiàn)象就被稱作尋址沖突,此時就必須要進行預(yù)充電來關(guān)閉工作行,再對新行發(fā)送行有效命令。結(jié)果,總耗時就是tRP+tRCD+CL,這種情況我們稱之為頁錯失(PM,Page Miss)。
顯然,PFH是最理想的尋址情況,PM則是最糟糕的尋址情況。上述三種情況發(fā)生的機率各自簡稱為PHR--PH Rate、PFHR--PFH Rate、PMR--PM Rate。因此,系統(tǒng)設(shè)計人員(包括內(nèi)存與北橋芯片)都盡量想提高PHR與PFHR,同時減少PMR,以達(dá)到提高內(nèi)存工作效率的目的。
二、增加PHR的方法
顯然,這與預(yù)充電管理策略有著直接的關(guān)系,目前有兩種方法來盡量提高PHR。自動預(yù)充電技術(shù)就是其中之一,它自動的在每次行操作之后進行預(yù)充電,從而減少了日后對同一L-Bank不同行尋址時發(fā)生沖突的可能性。但是,如果要在當(dāng)前行工作完成后馬上打開同一L-Bank的另一行工作時,仍然存在tRP的延遲。怎么辦? 此時就需要L-Bank交錯預(yù)充電了。
VIA的4路交錯式內(nèi)存控制就是在一個L-Bank工作時,對下一個要工作的L-Bank進行預(yù)充電。這樣,預(yù)充電與數(shù)據(jù)的傳輸交錯執(zhí)行,當(dāng)訪問下一個L-Bank時,tRP已過,就可以直接進入行有效狀態(tài)了。目前VIA聲稱可以跨P-Bank進行16路內(nèi)存交錯,并以LRU算法進行預(yù)充電管理。
有關(guān)L-Bank交錯預(yù)充電(存取)的具體執(zhí)行在本刊2001年第2期已有詳細(xì)介紹,這里就不再重復(fù)了。
L-Bank交錯自動預(yù)充電/讀取時序圖(可點擊放大):L-Bank 0與L-Bank 3實現(xiàn)了無間隔交錯讀取,避免了tRP對性能的影響。
三、增加PFHR的方法
無論是自動預(yù)充電還是交錯工作的方法都無法消除tRCD所帶來的延遲。要解決這個問題,就要盡量讓一個工作行在進行預(yù)充電前盡可能多的接收多個工作命令,以達(dá)到背靠背的效果,此時就只剩下CL所造成的讀取延遲了(寫入時沒有延遲)。
如何做到這一點呢?這就是北橋芯片的責(zé)任了。在上文的時序圖中有一個參數(shù)tRAS(Active to Precharge Command,行有效至預(yù)充電命令間隔周期)。它有一個范圍,對于PC133標(biāo)準(zhǔn),一般是預(yù)充電命令至少要在行有效命令5個時鐘周期之后發(fā)出,最長間隔視芯片而異(基本在120000ns左右),否則工作行的數(shù)據(jù)將有丟失的危險。那么這也就意味著一個工作行從有效(選通)開始,可以有120000ns的持續(xù)工作時間而不用進行預(yù)充電。顯然,只要北橋芯片不發(fā)出預(yù)充電(包括允許自動預(yù)充電)的命令,行打開的狀態(tài)就會一直保持。在此期間的對該行的任何讀寫操作也就不會有tRCD的延遲?梢,如果北橋芯片在能同時打開的行(頁)越多,那么PFHR也就越大。需要強調(diào)的是,這里的同時打開不是指對多行同時尋址(那是不可能的),而是指多行同時處于選通狀態(tài)。我們可以看到一些SDRAM芯片組的資料中會指出可以同時打開多少個頁的指標(biāo),這可以說是決定其內(nèi)存性能的一個重要因素。
Intel 845芯片組MCH的資料:其中表明它可以支持24個頁面同時處于打開狀態(tài)
但是,可同時打開的頁數(shù)也是有限制的。從SDRAM的尋址原理講,同一L-Bank中不可能有兩個打開的行(S-AMP只能為一行服務(wù)),這就限制了可同時打開的頁面總數(shù)。以SDRAM有4個L-Bank,北橋最多支持8個P-Bank為例,理論上最多只能有32個頁面能同時處于打開的狀態(tài)。而如果只有一個P-Bank,那么就只剩下4個頁面,因為有幾個L-Bank才能有同時打開幾個行而互不干擾。Intel 845的MHC雖然可以支持24個打開的頁面,那也是指6個P-Bank的情況下(845MCH只支持6個P-Bank)?梢845已經(jīng)將同時打開頁數(shù)發(fā)揮到了極致。
不過,同時打開頁數(shù)多了,也對存取策略提出了一定的要求。理論上,要盡量多地使用已打開的頁來保證最短的延遲周期,只有在數(shù)據(jù)不存在(讀取時)或頁存滿了(寫入時)再考慮打開新的指定頁,這也就是變向的連續(xù)讀/寫。而打開新頁時就必須要關(guān)閉一個打開的頁,如果此時打開的頁面已是北橋所支持的最大值但還不到理論極限的話,就需要一個替換策略,一般都是用LRU算法來進行,這與VIA的交錯控制大同小異。
編輯:simon 最后修改時間:2019-07-16