如果您希望可以時常見面,歡迎標星收藏哦~
科學家預測,到 2040 年,全球近 50% 的電力將用于計算。更重要的是,這一預測是在生成式人工智能突然爆發之前做出的。在過去的十年里,用于訓練最大的人工智能模型的計算資源量大約每 6 個月就翻一番。按照這個速度,到 2030 年,訓練一個人工智能模型所需的計算資源將是當前十大超級計算機每年資源總和的一百倍。
簡而言之,計算將需要大量的電力,很快就會超出我們的星球所能提供的能力。
管理計算領域不可持續的能源需求的一種方法是從根本上改變我們的計算方式。超導體可以讓我們做到這一點。
超導體提供了大幅降低能耗的可能性,因為它們在通過電流時不會耗散能量。確實,超導體只能在低溫下工作,需要一些冷卻開銷。但作為交換,它們提供幾乎零電阻互連、基于超短脈沖構建的需要最少能量的數字邏輯,以及由于簡單的 3D 芯片堆疊而提供令人難以置信的計算密度的能力。
這些優勢是否足以克服低溫冷卻的成本?我們的研究表明他們肯定是這樣的。隨著計算資源規模變大,冷卻開銷的邊際成本變小。我們的研究表明,從每秒約 1016 次浮點運算開始,超導計算機輕松變得比其經典計算機更加節能。這正是當今典型高性能計算機的規模,因此現在正是超導超級計算機的時代。
在 Imec,我們過去兩年一直在開發可以使用標準 CMOS 工具制造的超導處理單元?;谶@項工作的處理器的能源效率將是當今最高效芯片的一百倍,并且它將導致計算機將數據中心的計算資源放入鞋盒大小的系統中。
節能計算的物理原理
超導性早在 1911 年就被發現了,而將其用于計算的想法自 20 世紀 50 年代中期就已存在。但是,盡管該技術有望降低功耗和提高計算密度,但仍無法與摩爾定律下 CMOS 縮放技術的驚人進步相競爭。幾十年來,研究一直在持續,橫濱國立大學的一個小組于 2020 年展示了超導 CPU 。然而,作為計算的輔助手段,超導性在很大程度上仍局限于實驗室。
為了將這項技術帶出實驗室并實現可擴展的設計,以便在現實世界中具有競爭力,我們必須改變 Imec 的方法。我們不是從下往上發明一個系統——也就是說,從物理實驗室中可行的東西開始,希望它有用——我們是從上往下設計的——從必要的功能開始,直接與 CMOS 工程師和一個完整的團隊合作。堆棧開發團隊確保可制造性。該團隊不僅致力于制造工藝,還致力于軟件架構、邏輯門以及邏輯和存儲元件的標準單元庫,以構建完整的技術。
然而,節能計算背后的基本思想早在1991 年就已被開發出來。在傳統處理器中,大部分功耗和散熱來自邏輯單元之間或邏輯與存儲元件之間的信息移動,而不是來自實際操作。然而,由超導材料制成的互連不會耗散任何能量。這些電線的電阻為零,因此在處理器內移動位只需要很少的能量。即使在非常高的通信頻率下,這種能量損耗極低的特性也適用,在這種情況下,普通互連的性能會急劇上升。
進一步的節能來自于超導計算機內部的邏輯處理方式。超導邏輯的基本元件不是晶體管,而是約瑟夫森結。約瑟夫森結是一個三明治——擠壓在兩個超導體之間的一層薄薄的絕緣材料。連接兩個超導體,你就擁有了一個約瑟夫森結環路。
在正常情況下,環路中的絕緣“meat”非常薄,無法阻止超電流——整個三明治只是充當超導體。然而,如果將電流增加到超過稱為臨界電流的閾值,絕緣體周圍的超導“面包片”就會短暫地脫離超導狀態。在此過渡期間,結會發出微小的電壓脈沖,僅持續一皮秒,僅消耗 2 x 10-20焦耳,這是將一位信息寫入傳統閃存所需能量的千億分之一。
關鍵在于,由于超導回路中一種稱為磁通量量子化的現象,該脈沖始終完全相同。它被稱為磁通量的“單通量量子”,其值固定為 2.07 毫伏皮秒。將電感器放入約瑟夫森結環路內,電壓脈沖驅動電流。由于環路是超導的,因此該電流將無限期地繼續繞環路流動,而無需使用任何進一步的能量。
超導計算機內部的邏輯運算是通過操縱這些微小的量化電壓脈沖來完成的。具有 SFQ 持續電流值的約瑟夫森結環路充當邏輯 1,而無電流環路則充當邏輯 0。
信息存儲是 CPU 緩存中基于約瑟夫森結的 SRAM 版本,也存儲單通量量子。為了存儲一位,需要將兩個約瑟夫森結環路放置在彼此旁邊。左側回路中有持續電流的 SFQ 是存儲邏輯 0 的存儲元件,而左側沒有電流但右側回路中有電流的存儲元件是邏輯 1。
通過全棧開發取得進展
為了從實驗室好奇心轉變為準備制造的芯片原型,我們必須對整個硬件堆棧進行創新。這分為三個主要層面:工程所用的基本材料、電路開發和建筑設計。這三層必須結合在一起——一套新材料需要新的電路設計,而新的電路設計需要新穎的架構來整合它們。跨越所有三個階段的共同開發以及嚴格遵守 CMOS 制造能力是成功的關鍵。
在材料層面,我們不得不放棄以前實驗室最喜歡的超導材料:鈮。雖然鈮很容易建模并且在可預測的實驗室條件下表現良好,但按比例縮小卻非常困難。鈮對工藝溫度及其周圍材料都很敏感,因此它與標準 CMOS 工藝不兼容。因此,我們改用相關的化合物鈮鈦氮化物作為我們的基礎超導材料。鈮鈦氮化物可以承受 CMOS 制造中使用的溫度,而不會失去其超導能力,并且與周圍層的反應要少得多,使其成為更實用的選擇。
此外,我們還為約瑟夫森結三明治的meat層采用了一種新材料——非晶硅或阿爾法硅。傳統的約瑟夫森結材料,尤其是氧化鋁,不能很好地按比例縮小。使用鋁是因為它“潤濕”鈮,使表面光滑,并且氧化物以良好控制的方式生長。然而,為了達到我們目標的超高密度,我們必須使氧化物太薄而無法實際制造。相比之下,阿爾法硅允許我們在相同的臨界電流下使用更厚的勢壘。
我們還必須設計一種為約瑟夫森結供電的新方法,該方法可以縮小到芯片的尺寸。以前,基于實驗室的超導計算機使用變壓器將電流傳輸到其電路元件。然而,在每個電路元件附近放置一個笨重的變壓器是行不通的。相反,我們設計了一種通過創建諧振電路來同時向芯片上的所有元件供電的方法,并在整個芯片中散布著專用電容器。
在電路層面,我們必須重新設計整個邏輯和存儲結構,以利用新材料的功能。我們設計了一種新穎的邏輯架構,稱為脈沖守恒邏輯。脈沖守恒邏輯的關鍵要求是元件具有與輸出一樣多的輸入,并且單個通量量子的總數是守恒的。該邏輯是通過將單個通量量子通過約瑟夫森結環路和電感器的組合路由到適當的輸出來執行的,從而產生邏輯“或”和“與”。為了補充邏輯架構,我們還重新設計了兼容的基于約瑟夫森結的 SRAM。
最后,我們必須進行架構創新,以充分利用新穎的材料和電路設計。其中包括將傳統硅 DRAM 冷卻至 77 開爾文,并在 77-K 部分和主超導部分之間設計一個玻璃橋,該部分在 4 K 下運行,并使用細線實現無需熱混合的通信。我們還提出了一種將芯片堆疊在一起的方法,并正在開發垂直超導互連以連接電路板。
鞋盒大小的數據中心
結果是基于超導體的芯片設計,針對人工智能處理進行了優化。放大其中一塊板可以發現它與典型的 3D CMOS 片上系統有許多相似之處。該板由計算芯片組成:我們稱之為超導處理單元 ,具有嵌入式超導 SRAM、DRAM 內存堆棧和交換機,所有這些都通過硅中介層或玻璃橋先進封裝技術互連。
但也存在一些顯著差異。首先,芯片的大部分部分將浸沒在液氦中以冷卻至僅 4 K。這包括 SPU 和 SRAM,它們依賴于超導邏輯而不是 CMOS,并且安裝在插入板上。接下來,有一座玻璃橋通向較溫暖的區域,即托管 DRAM 的溫和 77 K。DRAM 技術不是超導技術,而是傳統 CMOS 從室溫冷卻的技術,使其更加高效。從那里,定制連接器將數據傳入和傳出室溫世界。
摩爾定律依賴于將越來越多的計算資源放入同一空間。隨著晶體管的縮小變得越來越困難,半導體行業正在轉向芯片的3D 堆疊以保持密度的提高。在傳統的基于 CMOS 的技術中,將計算芯片堆疊在一起非常具有挑戰性,因為芯片內會散發大量的功率和熱量。在超導技術中,消耗的少量功率很容易被液氦消除。邏輯芯片可以使用先進的 3D 集成技術直接堆疊,從而使芯片之間的連接更短、更快,并且占用空間更小。
將多塊 3D 超導芯片板堆疊在一起也很簡單,它們之間只留下很小的空間。我們對 100 塊此類板的堆疊進行了建模,所有板都在相同的冷卻環境中運行,并包含在 20 x 20 x 12 厘米的體積中,大致相當于鞋盒的大小。我們計算出該堆??梢詧绦?20 exaflops,是當今最大超級計算機容量的 20 倍。更重要的是,該系統承諾總功率僅消耗500千瓦。這意味著能源效率是當今最高效的超級計算機的一百倍。
到目前為止,我們已經在接下來的三代中縮小了約瑟夫森結和互連尺寸。展望未來,Imec 的路線圖包括解決 3D 超導芯片集成和冷卻技術。對于第一代,路線圖設想堆疊約 100 個板以獲得 20 exaflops 的目標性能。逐漸地,越來越多的邏輯芯片將被堆疊,并且電路板的數量將減少。這將進一步提高性能,同時降低復雜性和成本。
超導愿景
我們并不認為超導數字技術將取代傳統的 CMOS 計算,但我們確實希望它能夠補充 CMOS 的特定應用,并推動新應用的創新。首先,這項技術將與同樣基于超導技術構建的量子計算機無縫集成。也許更重要的是,我們相信它將支持人工智能和機器學習處理的增長,并有助于以比目前更可持續的方式提供基于云的大型人工智能模型訓練。
此外,利用這項技術,我們可以設計占地面積更小的數據中心。較小的數據中心可以放置在靠近目標應用程序的地方,而不是放置在一些遙遠的足球場大小的設施中。
這種變革性的服務器技術是科學家的夢想。它為基于真實數據的人工智能模型在線訓練打開了大門,這些數據是活躍變化的環境的一部分。以潛在的機器人農場為例。如今,訓練這些將是一項具有挑戰性的任務,因為所需的處理能力只能在遙遠的、耗電的數據中心提供。借助緊湊的附近數據中心,可以立即處理數據,從而使人工智能能夠了解農場的當前狀況
同樣,這些微型數據中心可以散布在能源網格中,在每個節點立即學習并在世界各地更有效地分配電力。想象一下智能城市、移動醫療保健系統、制造、農業等,所有這些都受益于相鄰人工智能學習者的即時反饋,實時優化和改進決策。
點這里加關注,鎖定更多原創內容
今天是《半導體行業觀察》為您分享的第3768期內容,歡迎關注。
『半導體第一垂直媒體』
實時 專業 原創 深度
公眾號ID:icbank
喜歡我們的內容就點“在看”分享給小伙伴哦
免責聲明:該文章系本站轉載,旨在為讀者提供更多信息資訊。所涉內容不構成投資、消費建議,僅供讀者參考。
2023-06-24
2023-06-24
2023-06-20
2023-06-20
2023-06-20