国产熟女一区二区三区四区,久久久久久久久国产精品无码色欲 ,亚洲人网站,精品自拍18,色偷偷男人天堂av

CPO,勢(shì)不可擋

時(shí)間:2025-06-22 13:19:19 來(lái)源:證券之星 閱讀量:14835

公眾號(hào)記得加星標(biāo)??,第一時(shí)間看推送不會(huì)錯(cuò)過(guò)。

2025 年 OFC 展會(huì)明確表明:數(shù)據(jù)中心向 CPO 交換機(jī)的轉(zhuǎn)型不可避免,其主要驅(qū)動(dòng)力在于 CPO 帶來(lái)的功耗節(jié)省。

從黃仁勛在 2025 年 GTC 大會(huì)上展示 CPO 交換機(jī),到眾多廠商在 2025 年 OFC 展會(huì)上演示集成在 ASIC 封裝內(nèi)的光引擎,共封裝光學(xué)技術(shù)已無(wú)處不在。

值得注意的是,Arista 聯(lián)合創(chuàng)始人、數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域的長(zhǎng)期遠(yuǎn)見(jiàn)者安迪?貝托爾斯海姆尚未改變立場(chǎng)。在 2025 年 OFC 展會(huì)上,他繼續(xù)主張線性可插拔光學(xué)(LPO)是更優(yōu)選擇。LPO 移除了板載數(shù)字信號(hào)處理器,功耗較傳統(tǒng)可插拔光學(xué)器件顯著降低 —— 通常減少 30-50%。更多細(xì)節(jié)可查看我的帖子。

安迪的核心論點(diǎn)是,至少在 1600G 代際,LPO 與 CPO 的功率效率大致相當(dāng)。那么,為何要接受 CPO 額外的復(fù)雜性呢?然而,在這些更高的 SerDes 速率下,LPO 面臨著 ASIC 與面板光器件之間電通道插入損耗的挑戰(zhàn)。安迪認(rèn)為,在 1600G 代際,可通過(guò)帶近封裝連接器的跨接電纜來(lái)緩解這一問(wèn)題。

他對(duì) CPO 的擔(dān)憂包括:失去配置靈活性、光器件類型混合搭配的困難,以及潛在的廠商互操作性和可維護(hù)性挑戰(zhàn)。眾所周知,光模塊會(huì)出現(xiàn)硬故障和軟故障。即使是高質(zhì)量光器件,硬故障率約為 100 FIT,而軟故障(通常由連接器灰塵引起)更為常見(jiàn)。采用 CPO 時(shí),檢查或更換故障光器件所需時(shí)間長(zhǎng)得多。更糟的是,封裝內(nèi)嵌入的光端口故障會(huì)導(dǎo)致交換機(jī)吞吐量下降,且難以更換。

這些擔(dān)憂并非新鮮事,但行業(yè)在過(guò)去兩年已取得顯著進(jìn)展。CPO 技術(shù)如今可靠性大幅提升。展望 400G 每通道 SerDes 代際,CPO 可能成為唯一可行選擇。在如此高的速率下,即使是最佳的 PCB 走線或跨接電纜也可能引入過(guò)多插入損耗。屆時(shí),在封裝內(nèi)實(shí)現(xiàn)光信號(hào)傳輸將成為必要。

因此,若轉(zhuǎn)型不可避免,為何不更早擁抱 CPO 并助力其演進(jìn)呢?看看 Arista 在為其淺緩沖交換機(jī)產(chǎn)品線采用 CPO 之前能堅(jiān)持多久,將是一件有趣的事!

CPO 集成

無(wú)論是共封裝還是作為可插拔模塊一部分的光收發(fā)器,其光引擎通常包含電子集成電路和光子集成電路(PIC)。

在包含交換機(jī)或 XPU 核心的 ASIC 封裝內(nèi)集成這些光引擎,主要有兩種方式。

硅中介層方案

核心裸片與電子 IC可共置于硅中介層上(或通過(guò)英特爾 EMIB 等硅橋連接),而 PIC 則要么 3D 堆疊在 EIC 上方,要么放置在有機(jī)基板中。當(dāng) PIC/EIC 堆疊在硅中介層上的核心裸片旁時(shí),它們也被稱為光學(xué) I/O。

該方案的目標(biāo)是通過(guò)利用高密度 D2D 鏈路和中介層布線,縮短并改善核心裸片與光引擎之間的電連接。這種中介層方案允許將多個(gè)光學(xué)小芯片更靠近主裸片放置,從而實(shí)現(xiàn)更小的封裝。

然而,將高功耗 EIC 與核心裸片共置于中介層上會(huì)使熱管理復(fù)雜化。此外,若 PIC 堆疊在 EIC 上,EIC 的散熱將更加困難。大型硅中介層會(huì)增加封裝成本和復(fù)雜性,且中介層尺寸限制了可圍繞 ASIC 布置的光模塊數(shù)量。為在不增加復(fù)雜性或成本的前提下提升帶寬,光引擎需要具備更高的帶寬密度。

有機(jī)基板方案

第二種方案將光引擎保留在 ASIC 封裝內(nèi)的有機(jī)基板上。PIC 和 EIC 被組裝在一起(通常是 PIC 在底部堆疊于 EIC 上方),形成緊湊的光引擎模塊,然后安裝在主裸片周圍的有機(jī)基板上。核心裸片通過(guò) SerDes 接口與 EIC 通信,在最新工藝節(jié)點(diǎn)中,該接口通常具有 500-1000 Gbps/mm 的帶寬密度。這意味著,一個(gè)面積為 625 平方毫米(每邊 25 毫米)的核心裸片可向光引擎發(fā)送約 100 Tbps 的帶寬。為實(shí)現(xiàn)超過(guò) 100 Tbps 的帶寬,封裝內(nèi)通常需要多個(gè)核心裸片。

該方案允許光引擎在基板上間隔布置,從而在一定程度上放寬了對(duì)每個(gè)引擎的光帶寬密度要求。由于引擎與主裸片距離較遠(yuǎn),這有助于熱隔離。每個(gè)光引擎可配備獨(dú)立的微型散熱器,或通過(guò)間隔布置使氣流或冷板能夠觸及。重要的是,將 PIC 堆疊在 EIC 下方比反向堆疊具有更好的散熱和信號(hào)性能。

由于不受大型中介層的限制,若有需要,封裝可做得更大以容納更多引擎。盡管組裝過(guò)程仍然復(fù)雜,但具有模塊化特點(diǎn)。光引擎可在安裝到有機(jī)基板之前進(jìn)行獨(dú)立測(cè)試。這是集成 CPO 的流行方案。

光學(xué)器件各種集成技術(shù)示意圖。引自 ASE

什么是帶寬密度?

并非所有 CPO 解決方案都相同。任何 CPO 解決方案的最終目標(biāo)都是以最低功耗實(shí)現(xiàn)高帶寬密度。這就引出了下一個(gè)問(wèn)題:帶寬密度究竟是什么?

在 CPO 和光學(xué) I/O 的語(yǔ)境中,帶寬密度描述的是沿光接口集成邊緣每毫米可傳輸?shù)臄?shù)據(jù)量,單位通常為太比特每秒(Tbps)。請(qǐng)注意,該指標(biāo)并非在面板連接器級(jí)別測(cè)量,而是在 ASIC 裸片邊緣或與 ASIC 共封裝的光子小芯片 / 光引擎邊緣測(cè)量。這些是封裝內(nèi)光纖或波導(dǎo)耦合的物理邊界。

方案對(duì)比:博通 vs 英偉達(dá)

現(xiàn)在,為理解共封裝光學(xué),讓我們更深入地考察博通和英偉達(dá)的 CPO 產(chǎn)品。

封裝帶寬

博通去年推出了 Bailly CPO 交換機(jī)。該交換機(jī)基于 Tomohawk-5 ASIC,封裝內(nèi)集成了八個(gè) 6.4 Tbps 光引擎,總封裝外光帶寬為 51.2 Tb/s。

博通 Bailly CPO ASIC

我們預(yù)計(jì)下一代 102.4 Tbps CPO 交換機(jī)將采用演進(jìn)的 CPO 架構(gòu),圍繞 Tomohawk-6 裸片部署改進(jìn)的硅光子引擎。這些約 100 Tbps 的交換機(jī)可能在今年下半年面市。

博通制造的芯片可供交換機(jī)廠商用于構(gòu)建系統(tǒng)。已有幾家公司處于使用 Bailly 交換機(jī)開(kāi)發(fā)交換機(jī)的不同階段。在所有這些交換機(jī)產(chǎn)品中,均使用單個(gè) Baily 芯片(面板具有 128×400G 端口)構(gòu)建獨(dú)立系統(tǒng)。

英偉達(dá)在 2025 年 GTC 大會(huì)上推出的共封裝光學(xué)平臺(tái)目標(biāo)更高,可擴(kuò)展至 100 Tb/s 及以上。

Quantum-X InfiniBand 交換機(jī)系統(tǒng)將具備:

144 個(gè) 800 Gb/s 端口,總計(jì) 115.2 Tbps 帶寬

四個(gè)采用 Quantum X800 ASIC 的 Quantum-X CPO 封裝,每個(gè)封裝具備 28.8 Tbps 帶寬

若要通過(guò) 28.8 Tbps 交換機(jī)實(shí)現(xiàn) 115.2 Tbps 的無(wú)阻塞交換容量,采用 Clos 架構(gòu)時(shí)所需交換機(jī)數(shù)量將遠(yuǎn)多于四個(gè)。鑒于目前似乎僅有四個(gè)交換機(jī),這看起來(lái)并非真正的 115.2 Tbps 交換機(jī)。對(duì)此有何評(píng)論?

預(yù)計(jì) 2025 年底面市。

Quantum-X 光子交換機(jī)系統(tǒng)。引自 2025 年 GTC 大會(huì)演示

Spectrum-X 光子以太網(wǎng)交換機(jī)系列將具備:

128 個(gè) 800G 端口,提供 102.4 Tb/s 帶寬。這可能包含兩個(gè) Spectrum-X CPO 封裝,每個(gè)封裝具備 51.2 Tbps 帶寬(64×800 Gbps 或 256×200 Gbps)

還將提供更大配置,包含 512 個(gè) 800G 端口,可能采用 4 個(gè) CPO 封裝

與 Quantum 類似,除非在交換機(jī)機(jī)箱內(nèi)使用更多交換機(jī)用于芯片間連接,否則這些并非真正的 102.4 T 或 409.6 Tbps 交換機(jī)

預(yù)計(jì) 2026 年面市

因此,在容量方面,博通目前擁有 51.2T 解決方案,與當(dāng)前網(wǎng)絡(luò)需求一致,2025 年路線圖中規(guī)劃了 100 Tbps;而英偉達(dá)則跨越式發(fā)展至 100-400T,以滿足未來(lái)百萬(wàn) GPU 集群需求(200G Serdes)。英偉達(dá)更大的帶寬數(shù)字反映了其更激進(jìn)的架構(gòu)方案,專注于通過(guò)大規(guī)模集成(系統(tǒng)內(nèi)使用多個(gè)光子交換機(jī)芯片)實(shí)現(xiàn)更高基數(shù)的交換機(jī)。

光引擎

博通 Bailly 芯片在 ASIC 封裝內(nèi)集成了 6.4 Tbps 硅光子基光引擎。這些高密度邊緣安裝的光引擎通過(guò)有機(jī)基板上的短芯片間連接直接與核心裸片交互。這種緊密集成實(shí)現(xiàn)了更簡(jiǎn)單的物理布局。

英偉達(dá)的 Spectrum-X和 Quantum-X(InfiniBand)光子交換機(jī)也集成了多個(gè) 1.6 Tbps 硅光子基光子引擎。每個(gè)光子引擎采用臺(tái)積電 COUPEtrade;工藝制造,將電子裸片(EIC)堆疊在光子裸片上方。三個(gè)此類引擎集群組成可拆卸光子組件(OSA),吞吐量達(dá) 4.8 Tbps。這意味著光引擎(及其光纖接口)位于可更換模塊上,與交換機(jī)基板對(duì)接,而非像博通方案那樣永久粘合!

引自 2025 年 GTC 大會(huì)演示。英偉達(dá) CPO 可視化

因此,英偉達(dá)的封裝更為復(fù)雜,采用先進(jìn)的 2.5D/3D 集成和光部件的模塊化連接系統(tǒng)。這在一定程度上解決了可維護(hù)性擔(dān)憂。若在制造測(cè)試中發(fā)現(xiàn)插件模塊故障,可更換為其他模塊。

在 Quantum-X CPO 交換機(jī)中,每個(gè) ASIC 封裝包含 Quantum X800 28.8 Tbps 交換機(jī) ASIC 核心,以及連接至主封裝的六個(gè) OSA 插件模塊。

總之,博通方案是光器件嵌入的單封裝交換機(jī),而英偉達(dá)方案則是具備可拆卸光子模塊的新型封裝。

Spectrum-X CPO 封裝讓我們對(duì)小芯片架構(gòu)有了更多了解。它似乎將主核心交換機(jī)裸片與八個(gè) I/O 裸片緊密集成,而光子引擎(36 個(gè))圍繞它們布置在有機(jī)基板中。這些光子引擎是否屬于可拆卸 OSA 的一部分尚不可知。

Quantum-X 和 Spectrum-X CPO 封裝。引自 2025 年 GTC 大會(huì)演示

光纖耦合

博通 CPO 交換機(jī)采用光引擎的邊緣耦合光纖連接,以實(shí)現(xiàn)高前沿密度。每個(gè)光引擎 PIC 上有承載光信號(hào)的片上波導(dǎo),這些波導(dǎo)終止于光子小芯片邊緣。光纖被精確對(duì)準(zhǔn)并永久粘合到這些波導(dǎo)端面。

博通已開(kāi)發(fā)出高度自動(dòng)化的高密度光纖連接工藝,可將多根光纖芯精確對(duì)準(zhǔn)光子小芯片邊緣。這種邊緣耦合方案允許大量光通道以緊湊的占用面積從封裝中引出。

在第一代 CPO 中,博通似乎使用 400G-FR4,通過(guò) CWDM 在單根光纖上實(shí)現(xiàn)四個(gè) 100G 通道。如此,每個(gè)光引擎配備 16 對(duì)光纖以處理 6.4T 吞吐量。然而,博通可能正在開(kāi)發(fā)新版本芯片,配備 64 對(duì)光纖(每對(duì)承載 100 Gbps),以支持更大基數(shù)的交換機(jī)(512×100G 端口)。

直接從光引擎引出的短光纖稱為 “光纖尾纖”。光引擎引出的光纖尾纖必須路由至面板連接器,但這些尾纖短而脆弱,無(wú)法直接路由至面板。ASIC 引出的光纖尾纖通常通過(guò)連接器在交換機(jī)盒內(nèi)部與更長(zhǎng)、更堅(jiān)固的光纖連接,后者再延伸至面板。

英偉達(dá) Quantum-X InfiniBand 交換機(jī)封裝每個(gè) CPO 封裝有 324 個(gè)光連接。為支持 144×200 Gbps,需要 144 對(duì)光纖,剩余 36 個(gè)用于連接 ASIC 的激光器 ——18 個(gè)光子引擎各獲得兩個(gè)激光輸入。

四對(duì)光纖每組匯聚為一個(gè) DR4,并在面板處端接至單個(gè) MPO(多光纖推入式)連接器。因此,配備 4 個(gè) CPO 封裝的交換機(jī)系統(tǒng)在面板處有 144 個(gè) MPO。

盡管耦合方法的細(xì)節(jié)尚未完全公開(kāi),但英偉達(dá)很可能也在光子引擎上使用邊緣耦合。

總之,博通和英偉達(dá)都必須解決大規(guī)模光纖耦合問(wèn)題。博通在第一代 CPO 交換機(jī)中依靠 WDM 減少光纖數(shù)量,而從 GTC 演示中的光纖數(shù)量來(lái)看,英偉達(dá)似乎未使用 WDM。

激光器集成

CPO 設(shè)計(jì)中最大的考量之一是如何處理為光引擎內(nèi)調(diào)制器提供光源的激光器。

博通和英偉達(dá)的設(shè)計(jì)均將所有高功率激光器置于主交換機(jī)封裝之外,轉(zhuǎn)而使用外部可插拔激光模塊。這些模塊可插入面板 LC 端口,接受熱插拔激光 cartridges。

光纖跳線將連續(xù)波光從這些激光模塊傳輸至共封裝光引擎。該策略可保持 CPO 的低功耗并提高其可靠性。激光器的退化可能快于其他組件,因此外部激光器可輕松更換,而無(wú)需干擾交換機(jī) ASIC。

Bailly 交換機(jī)使用 16 個(gè)高效可插拔激光模塊,每個(gè) 6.4 Tbps 光引擎配備兩個(gè)模塊。

英偉達(dá)的方案更進(jìn)一步,大幅減少了所需激光源的總數(shù)。在 Quantum-X 光子交換機(jī)系統(tǒng)中,僅 18 個(gè)面板連接的激光模塊為所有 144×800G 光通道提供光源。每個(gè)模塊集成八個(gè)激光器,為八個(gè) 1.6 Tbps 光子引擎提供光源。因此,英偉達(dá)架構(gòu)的可插拔激光模塊數(shù)量比博通方案少 4 倍。

更少的激光器意味著需要冷卻和監(jiān)控的組件更少,但這也意味著若某個(gè)激光模塊故障,受影響的通道會(huì)更多。

調(diào)制器

調(diào)制器是光引擎內(nèi)將電信號(hào)轉(zhuǎn)換為光信號(hào)的組件。它們從激光器獲取穩(wěn)定光,并通過(guò)將光轉(zhuǎn)換為強(qiáng)度或相位調(diào)制的光數(shù)據(jù)流,將高速數(shù)據(jù) “印刻” 在其上。深入理解這些調(diào)制器的工作原理是一個(gè)超出我專業(yè)領(lǐng)域的技術(shù)話題。

簡(jiǎn)而言之,博通很可能使用馬赫 - 曾德?tīng)栒{(diào)制器。這類調(diào)制器對(duì)激光不穩(wěn)定性較不敏感,對(duì)溫度變化的耐受性更好,但功耗更高且占用面積更大(尺寸更大)。盡管 MZM 適用于 100 Gbps 信號(hào)傳輸,但在擴(kuò)展至~200G 通道和數(shù)百 Tbps CPO 封裝時(shí),會(huì)面臨密度和功耗限制。

這可能就是英偉達(dá) CPO 方案選擇微環(huán)諧振器調(diào)制器的原因。MRM 占用面積更小(可很好地?cái)U(kuò)展),所需驅(qū)動(dòng)電壓更低,因此功耗更低。這些調(diào)制器還原生支持 WDM;每個(gè)環(huán)針對(duì)一個(gè)波長(zhǎng),非常適合每根光纖 8-16 個(gè)波長(zhǎng)的系統(tǒng)。但這些調(diào)制器需要更多調(diào)諧(因其熱敏感性)和強(qiáng)大的 DSP 邏輯來(lái)減少串?dāng)_。英偉達(dá)選擇 MRM 表明其在 CPO 方案中對(duì)功耗節(jié)省的激進(jìn)追求。MRM 的功耗約為 1-2 pJ/bit,而 MZM 為 5-10 pJ/bit。

波分復(fù)用

博通在每根光纖上使用粗波分復(fù)用,采用 4 通道 4λ×100G 配置承載 400G。其文檔未解釋如何實(shí)現(xiàn) 800 Gbps 端口配置,可能涉及非標(biāo)準(zhǔn)配置,如聚合兩條 400G FR4 鏈路,或可能正在開(kāi)發(fā)支持 DR 鏈路(直接傳輸,無(wú) WDM,每根光纖承載 100G)的新版本 CPO 交換機(jī)。

從每個(gè) CPO 封裝的光纖對(duì)數(shù)量來(lái)看,英偉達(dá) Quantum-X 似乎不支持 WDM,這與 200G 端口數(shù)量一致。

功率效率與散熱

共封裝光學(xué)的主要?jiǎng)訖C(jī)之一是提升功率效率。博通和英偉達(dá)均報(bào)告稱,與傳統(tǒng)可插拔收發(fā)器相比,單位比特功耗顯著降低。

博通聲稱其共封裝光學(xué)每個(gè) 800 Gb/s 端口功耗約 5.5W,而等效可插拔模塊約為 15W。這 3 倍的降幅意味著滿載的 64 端口交換機(jī)可節(jié)省數(shù)百瓦功率。5.5W 的功耗轉(zhuǎn)化為光鏈路 6-7 pJ/bit 的功耗,這在 2024 年屬于領(lǐng)先水平。

冷卻此類系統(tǒng)比冷卻包含數(shù)十個(gè) 15W 可插拔器件的等效交換機(jī)更容易。盡管如此,51.2T CPO 交換機(jī)的 ASIC 封裝功率密度集中,仍會(huì)散發(fā)出大量熱量,需要冷板液冷。不過(guò),其單元很可能也可使用高性能風(fēng)冷。

英偉達(dá)同樣宣揚(yáng)效率大幅提升:通過(guò)使用微環(huán)調(diào)制器和更少的激光器,其硅光子交換機(jī)的網(wǎng)絡(luò)鏈路功率效率提升 3.5 倍。與博通類似,這些交換機(jī)需要液冷以有效散除 ASIC 封裝的熱量。事實(shí)上,GTC 大會(huì)上的 Quantum-X CPO 演示顯示,交換機(jī) ASIC 采用冷板液冷。

簡(jiǎn)而言之,兩種方案均實(shí)現(xiàn)了更低的 pJ/bit 功耗,使超高帶寬網(wǎng)絡(luò)更具可持續(xù)性。

突破帶寬墻 —— 未來(lái)方向

垂直耦合

傳統(tǒng)光引擎常使用邊緣耦合,將光纖對(duì)準(zhǔn)芯片邊緣的波導(dǎo)端面。帶 V 型槽光纖陣列的邊緣耦合是一種已知方法,可精確排列光纖并將其被動(dòng)對(duì)準(zhǔn)波導(dǎo)。

邊緣耦合器可實(shí)現(xiàn)低插入損耗,且易于連接光纖帶。然而,由于光纖必須并排布置且間距最小,它們會(huì)消耗大量邊緣長(zhǎng)度。

另一種方法是垂直耦合,使用片上衍射光柵耦合器或反射鏡將光從芯片頂面耦合出去。這允許光 I/O 布置在芯片區(qū)域內(nèi),而不僅限于周邊。垂直耦合器加上微透鏡陣列可實(shí)現(xiàn)相當(dāng)高的耦合密度,并可在光子裸片上方的任意位置靈活布置。其權(quán)衡通常是在擴(kuò)展至多根光纖時(shí)損耗更高且對(duì)準(zhǔn)更復(fù)雜。

盡管邊緣耦合目前占主導(dǎo)地位,但垂直耦合正在研究實(shí)驗(yàn)室和部分公司中積極探索,以克服邊緣長(zhǎng)度限制。

多芯光纖與光纖間距縮小

若每根光纖可承載多個(gè)纖芯,則對(duì)于給定的通道數(shù),邊緣的光纖數(shù)量可減少。多芯光纖(MCF)在單個(gè)光纖包層內(nèi)封裝多個(gè)獨(dú)立纖芯,通過(guò)在單個(gè)光纖橫截面內(nèi)堆疊通道,高效利用有限的前沿面積。例如,4 芯光纖可使每根光纖的通道數(shù)增至 4 倍,立即將邊緣通道密度提升 4 倍。盡管尚未在商用 CPO 產(chǎn)品中標(biāo)準(zhǔn)化,但它被視為解決光子前沿受限問(wèn)題的 “有吸引力的方案”。

MCF 的缺點(diǎn)在于,若系統(tǒng)需要連接至不同服務(wù)器 / NIC 的更多低帶寬端口基數(shù),在單根光纖內(nèi)聚合更多帶寬并非良策。

另一種增加光纖密度的方法是縮小間距。標(biāo)準(zhǔn)單模光纖帶間距約為 250 μm,通過(guò)使用更細(xì)光纖或去除緩沖層,可實(shí)現(xiàn) 50 μm 甚至更小的間距。IBM 已在可靠組裝中演示了 50 μm 光纖通道間距,實(shí)驗(yàn)室中使用定制聚合物光纖甚至實(shí)現(xiàn)了 18 μm 間距。如此小的間距可大幅增加 “每毫米光纖數(shù)”,使 ASIC 封裝能夠輸出更大帶寬。

先進(jìn)耦合器、透鏡與連接方法

隨著光纖間距縮小和數(shù)量增加,對(duì)準(zhǔn)容差成為挑戰(zhàn)。正在開(kāi)發(fā)光柵耦合器與微透鏡陣列等技術(shù),以緩解對(duì)準(zhǔn)限制,這可能實(shí)現(xiàn)光子芯片上方非常密集的 3D 堆疊光纖連接器陣列。

光纖連接方法也在演進(jìn)。如今許多 CPO 實(shí)現(xiàn)仍依賴光纖陣列的精確放置,然后用環(huán)氧樹(shù)脂固定。展望未來(lái),預(yù)計(jì)會(huì)看到更多連接器化解決方案,如英偉達(dá)的可拆卸模塊或初創(chuàng)公司提供的 “即插即用” 光插座小芯片。

WDM 是當(dāng)前實(shí)現(xiàn)每根光纖更多通道的方法,垂直耦合、多芯光纖、密集光纖和新型連接技術(shù)正在興起,以進(jìn)一步提升前沿密度。每種技術(shù)解決不同方面的問(wèn)題。下一代 CPO 實(shí)現(xiàn)正在探索結(jié)合多種方法,以在給定邊緣長(zhǎng)度內(nèi)提升總封裝外帶寬。

CPO 部署挑戰(zhàn)

主要挑戰(zhàn)并非核心技術(shù)本身,更多在于 CPO 對(duì)現(xiàn)有生態(tài)系統(tǒng)和運(yùn)營(yíng)模式的影響:

生態(tài)系統(tǒng)顛覆:CPO 從根本上改變了供應(yīng)鏈??蛻舨辉?gòu)亩嗉覐S商購(gòu)買可互換的可插拔模塊,而是必須從單一系統(tǒng)廠商或緊密合作的伙伴處采購(gòu)集成的 CPO 交換機(jī)或服務(wù)器。這降低了采購(gòu)靈活性,增加了廠商鎖定。

運(yùn)營(yíng)復(fù)雜性:現(xiàn)場(chǎng)更換和故障管理變得更加復(fù)雜。光引擎故障可能需要更換整個(gè) CPO 交換機(jī)線卡或服務(wù)器主板,而非僅更換可插拔模塊。大規(guī)模開(kāi)發(fā)適用于 CPO 系統(tǒng)的穩(wěn)健測(cè)試、診斷和修復(fù)策略是一項(xiàng)重大任務(wù)。

可靠性驗(yàn)證:盡管 CPO 通過(guò)消除可插拔連接器接口有望提供更高可靠性,但這需要通過(guò)大規(guī)模長(zhǎng)期部署來(lái)證明。CPO 可靠性數(shù)據(jù)已開(kāi)始出現(xiàn),但仍需更多驗(yàn)證。

成本:目前,CPO 與高容量可插拔光學(xué)器件相比無(wú)顯著成本優(yōu)勢(shì)。隨著產(chǎn)量上升,這種情況有望改變。

熱管理:在 ASIC 封裝內(nèi)集成對(duì)熱敏感的光組件帶來(lái)顯著熱管理挑戰(zhàn),液冷成為必需。

鑒于這些挑戰(zhàn)以及 1.6T 可插拔光學(xué)器件的快速成熟,在 200G / 通道代際,CPO 不太可能在橫向擴(kuò)展應(yīng)用中實(shí)現(xiàn)大規(guī)模部署。

但行業(yè)預(yù)計(jì)將看到越來(lái)越大的 CPO 測(cè)試部署,以驗(yàn)證技術(shù)和運(yùn)營(yíng)模式,可能為下一代大規(guī)模部署鋪平道路。

CPO 用于縱向擴(kuò)展?

CPO 在縱向擴(kuò)展用例中的前景似乎更為光明。在此場(chǎng)景中,整個(gè)機(jī)架解決方案(包括加速器、交換機(jī)和互連)更可能從單一廠商(如英偉達(dá))或緊密集成的合作伙伴處采購(gòu)。這簡(jiǎn)化了生態(tài)系統(tǒng)挑戰(zhàn),使 CPO 集成更為直接。

在 2025 年 GTC 大會(huì)上,黃仁勛推出了 NVL144,該產(chǎn)品在 200 Gbps 通道速率下繼續(xù)使用銅纜進(jìn)行 NVLink 互連。在這些速率下,銅纜可能體積龐大,電纜管理可能混亂。

光背板 / 中板鏈路在電纜和傳輸距離方面提供了巨大改進(jìn)。單根帶狀光纖可承載多個(gè)波長(zhǎng),取代數(shù)十根銅纜,這大大減輕了重量和擁塞,這不僅對(duì)散熱重要,對(duì)信號(hào)完整性也至關(guān)重要。光學(xué)器件還允許機(jī)箱尺寸擴(kuò)展,并創(chuàng)建跨多個(gè)機(jī)架的超大規(guī)??v向擴(kuò)展集群,而無(wú)需將所有組件限制在數(shù)米范圍內(nèi)。

配備用于 NVLink 互連的 CPO 的 GPU 和縱向擴(kuò)展交換機(jī)支持這些光背板。欲了解更多信息,可參考我關(guān)于寬總線光子背板及光背板其他趨勢(shì)的帖子。

然而,無(wú)源銅纜在功率方面仍具優(yōu)勢(shì),只要英偉達(dá)能在更低功耗下使其工作,就會(huì)繼續(xù)在縱向擴(kuò)展系統(tǒng)中使用銅纜。

縱向擴(kuò)展系統(tǒng)中 GPU的合理選擇可能是先過(guò)渡到 CPC(共封裝銅纜),這將消除 PCB 走線,完全依靠跨接銅纜實(shí)現(xiàn)背板連接,然后在鏈路速度達(dá)~400 Gbps 及以上時(shí)過(guò)渡到 CPO 和光互連。

對(duì)此你有何想法 / 觀點(diǎn)?

下一步是什么?光子織物 / 中介層?

除邊緣布置光引擎的傳統(tǒng) CPO 外,另一種方案是使用置于核心裸片下方的光子中介層或織物??蓪⑵湟暈?3D 堆疊配置,其中激光器、波導(dǎo)和光交換 / 路由位于基礎(chǔ)層,計(jì)算或存儲(chǔ)小芯片可安裝在其上方,這本質(zhì)上為小芯片提供了光主板。

由于光子中介層可以很大,它可提供非常長(zhǎng)的 “邊緣”—— 一個(gè)用于光 I/O 的連續(xù) 2D 表面。因此,每毫米邊緣的有效帶寬可能遠(yuǎn)高于分散布置的多個(gè)獨(dú)立光引擎所能實(shí)現(xiàn)的帶寬。

過(guò)去幾年,多家初創(chuàng)公司一直在積極探索這一領(lǐng)域,2025 年 OFC 展會(huì)上也有許多演示證明了其可行性。

Photonic fabrics 或中介層示意圖。引自 LightMatter

Photonic fabrics 的主要挑戰(zhàn)在于基礎(chǔ)層的光引擎會(huì)散發(fā)出大量熱量,使這種 3D 堆疊配置中的熱管理相當(dāng)困難。盡管演示主要展示頂部的測(cè)試芯片,但在真實(shí)的 3D 光子織物芯片中,核心裸片和光基礎(chǔ)層消耗大量功率,其熱管理情況將十分有趣。

一些初創(chuàng)公司也在研究Photonic fabrics ,以連接封裝內(nèi)的多個(gè) XPU。當(dāng)封裝內(nèi)有多個(gè)核心時(shí),Photonic fabrics 可在非相鄰核心之間提供連接,延遲遠(yuǎn)低于通過(guò)有機(jī)基板路由的傳統(tǒng)方法。

光子中介層另一示意圖。引自 Celestial.ai

光互連的另一應(yīng)用是將 XPU 連接至板上獨(dú)立 ASIC 封裝中容納的內(nèi)存池。由于光纖延遲低,這可實(shí)現(xiàn)內(nèi)存與 ASIC 的解耦。

然而,任何光連接的電光 - 光電轉(zhuǎn)換都會(huì)消耗大量功率。若超大規(guī)模集成的替代方案涉及多個(gè) ASIC 封裝和 PCB 走線,光子織物方案可能成為更優(yōu)解決方案。盡管如此,這些均屬于長(zhǎng)期發(fā)展。

當(dāng)今的重點(diǎn)是交換機(jī)用 CPO,因?yàn)檫@是迫在眉睫的痛點(diǎn),行業(yè)正為此興奮不已。CPO 交換機(jī)的成功部署將在技術(shù)、供應(yīng)鏈和對(duì)光學(xué)技術(shù)的信任方面為光子技術(shù)向其他領(lǐng)域擴(kuò)展鋪平道路!

未來(lái)令人興奮……

注:本入門指南主要聚焦于博通和英偉達(dá)的 CPO 解決方案。然而,許多廠商提供 CPO 中使用的各種組件以及在 XPU / 交換機(jī)中集成 CPO 的技術(shù)。本文更多是技術(shù)綜述,不打算涵蓋該生態(tài)系統(tǒng)中的所有廠商。

今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4072期內(nèi)容,歡迎關(guān)注。

加星標(biāo)??第一時(shí)間看推送,小號(hào)防走丟

求推薦



聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費(fèi)建議。文章事實(shí)如有疑問(wèn),請(qǐng)與有關(guān)方核實(shí),文章觀點(diǎn)非本網(wǎng)觀點(diǎn),僅供讀者參考。
hhx6 精彩圖片