6.5.8. 利用所有頻寬
在圖 5.4 中的數據顯示,當快取無效時,對遠端記憶體的存取並不顯著慢於對本地記憶體的存取。這表示,一支程式也許能藉著將它不必再次讀取的資料寫入到附屬於另一個處理器的記憶體中來節省頻寬。到 DRAM 模組的連線頻寬與交互連線的頻寬大多數是獨立的,所以平行使用能提升整體效能。
這是否真的可能,取決於許多因素。必須確保快取無效,否則與遠端存取相關的減慢是很顯著的。另一個大問題是,遠端節點是否有任何它所擁有的記憶體頻寬的需求。在採用這個方法之前,必須詳加檢驗這種可能性。理論上,使用一個處理器可用的所有頻寬可能有正面影響。一個 10h Opteron 家族的處理器能夠直接連接到高達四個其它的處理器。假如系統的其餘部分合作的話,利用所有這種額外頻寬,也許結合合適的預取(尤其是 prefetchw
),可能致使改進。