Intel 的 Ponte Vecchio 和 AMD 的 Zen 3 展示了先進半導體封裝技術的承諾

英特爾和 AMD 在本週的國際固態電路會議上討論了他們的一些最先進的晶片設計,他們強調了先進封裝在未來高階晶片產品中所發揮的作用。 在這兩種情況下,令人印象深刻的新性能能力都來自模組化方法,該方法將不同工廠使用不同製造工藝製造的構建塊結合起來。 它說明了晶片封裝在未來半導體創新中的巨大潛力。

英特爾 Ponte Vecchio 的目標市場是作為內建於大型資料中心系統中的高效能模組。 它是一個圖形處理單元 (GPU),專為人工智慧、機器學習和電腦圖形學應用而設計。 它因連接義大利佛羅倫薩阿爾諾河一側的領主廣場和另一側的皮蒂宮的中世紀石橋而得名。 該設計的亮點之一是它如何連接大量專用小晶片——旨在組合起來形成完整系統的集成電路構建塊。

老橋使用八塊“瓷磚”,採用台積電 (TSMC) 最先進的 5 奈米製程製造。 每個圖塊有八個“Xe” 核心,八個核心中的每一個又具有八個向量引擎和八個專用矩陣引擎。 這些區塊被放置在「基礎塊」的頂部,「基礎塊」透過一個巨大的交換結構將它們連接到記憶體和外部世界。 該基片採用該公司的「Intel 7」製程製造,該製程是該公司增強型 10 nm SuperFin 製造製程的新名稱。 還有一個名為“RAMBO”的高效能內存系統,它代表頻寬優化的隨機存取內存,它是在使用 Intel 7 Foveros 互連技術的基礎區塊上構建的。 還合併了許多其他構建塊。

Ponte Vecchio 設計是異質整合的一個案例研究 - 將 63 個不同的區塊(47 個執行計算功能,16 個用於熱管理)與總共超過 100 億個電晶體組合在一個 77.5 x 62.5 毫米(約 3 x 2.5 英吋)。 就在不久前,如此大的運算能力還裝滿了一個倉庫,並且需要自己連接到電網。 這種設計面臨的工程挑戰很多:

連接所有部件。 設計人員需要一種在所有不同晶片之間移動訊號的方法。 過去,這是透過印刷電路板上的電線或跡線來完成的,然後透過將晶片焊接到電路板上來將其連接起來。 但隨著訊號數量和速度的增加,這種方法很久以前就失去了動力。 如果將所有內容放入單一晶片中,則可以在製造過程的後端將它們與金屬跡線連接起來。 如果你想使用多個晶片,那就意味著你需要很多連接引腳,並且你希望連接距離短。 英特爾使用兩種技術來支持這一點。 第一個是其「嵌入式多晶片互連橋」(EMIB),它由一小片矽片製成,一次可以提供數百或數千個連接,第二個是其首創的Foveros 晶片到晶片堆疊技術用於 Lakefield 行動處理器。

確保所有部件同步。 連接許多不同的部件後,您需要確保所有部件都可以同步地相互通訊。 這通常意味著分配一個稱為時脈的定時訊號,以便所有晶片都能同步工作。 事實證明這並不是一件小事,因為訊號往往會出現偏差,而且環境非常吵雜,有大量訊號在周圍反彈。 例如,每個計算區塊在 7,000 平方毫米的空間中擁有 40 多個連接,因此需要保持大量同步。

管理熱量。 每個模組化瓷磚都需要大量電力,在整個表面上均勻地輸送電力,同時消除產生的熱量是一項巨大的挑戰。 記憶體晶片已經堆疊了一段時間,但產生的熱量分佈相當均勻。 處理器晶片或模組可能會出現熱點,這取決於它們的使用頻率,而管理 3D 晶片堆疊中的熱量並不容易。 英特爾在晶片背面採用金屬化工藝,並將其與散熱器集成,以處理 Ponte Vecchio 系統預計產生的 600 瓦功率。

英特爾報告的初步實驗室結果包括 >45 Teraflops 性能。 阿貢國家實驗室正在建造的 Aurora 超級電腦將使用超過 54,000 個 Ponte Vecchios 處理器以及超過 18,000 個新一代 Xeon 處理器。 Aurora 的目標峰值性能超過 2 Exaflops,是 Teraflop 機器的 1,000 倍。 早在 1990 年代中期,當我從事超級電腦業務時,一台 Teraflop 機器是一個價值 100 億美元的科學計畫。

AMD 的 Zen 3

AMD談論了其基於台積電3奈米製程所建構的Zen 7第二代微處理器核心。 此微處理器核心旨在用於 AMD 的各個細分市場,從低功耗行動裝置、桌上型計算機,一直到最強大的資料中心伺服器。 該戰略的核心原則是將具有支援功能的 Zen 3 核心封裝為單個小晶片上的“核心複合體”,該小晶片充當模組化構建塊,就像英特爾的模組一樣。 因此,他們可以將八個小晶片封裝在一起,形成高效能桌面或伺服器,或將四個小晶片封裝在一起,形成一個價值系統,例如我可能購買的廉價家用系統。 AMD 也使用所謂的矽通孔 (TSV) 垂直堆疊晶片,這是一種連接多個堆疊晶片的方法。 它還可以將兩到八個這樣的小晶片與採用 GlobalFoundries 12 nm 製程製造的伺服器晶片相結合,以製造其 3rd 一代 EPYC(霄龍)伺服器晶片。

Ponte Vecchio 和 Zen 3 強調的絕佳機會是混合和匹配使用不同製程製造的晶片的能力。 就英特爾而言,這包括採用自己以及台積電最先進製程所製造的零件。 AMD 可以結合台積電和 GlobalFoundries 的零件。 將較小的小晶片或塊連接在一起而不是僅僅構建一個大晶片的一大優點是較小的晶片將具有更好的製造產量,因此成本更低。 您也可以將新的小晶片與您認為好的、經過驗證的舊小晶片或採用更便宜的製程製造的小晶片混合搭配。

AMD 和 Intel 的設計都是技術性的 力作。 毫無疑問,它們代表著大量的辛勤工作和學習,代表著巨大的資源投資。 但正如IBM 在360 世紀1960 年代在其大型主機System/1980 中引入模組化子系統,以及個人電腦在XNUMX 年代走向模組化一樣,以這兩種設計為例並由先進晶片封裝實現的矽微系統的模組化分區預示著重大的技術轉變。 儘管這裡展示的許多功能仍然是大多數新創公司無法企及的,但我們可以想像,當該技術變得更容易獲得時,它將引發一波混合搭配創新浪潮。

資料來源:https://www.forbes.com/sites/willyshih/2022/02/22/intels-ponte-vecchio-and-amds-zen-3-show-the-promise-of-advanced-semiconductor-packaging-技術/