最近,谷歌的系統基礎設施副總裁阿米特?瓦達特 (Amit Vahdat) 在一篇博客文章中表示,谷歌將會用“位于同一芯片上或一個封裝內的多個芯片上的 SoC”,去逐漸替代“組件集成在一塊用幾英寸長的電線隔開的主板”,“SoC 就是新的主板”,這個方向將是“谷歌的下一步”。
Amit 這么一說,聽起來好像谷歌還在用著 20 年多前的計算機,主板上有各種各樣的分立功能芯片,谷歌急需提高系統集成度來降低主板上互聯電路的成本,提高性能。但實際情況真的是這樣嗎?
下圖是一塊幾年前的 Intel Xeon 服務器處理器的單 socket 主板,可以很清楚的看到,除了中間占了最大面積的處理器槽位以及網絡芯片外,整個主板上只剩下各種物理接口、電源管理、電阻電容等輔助器件。而中央的 Xeon 內部集成了多核處理器、顯示控制器(GPU)、PCIE 控制器、DDR Memory 控制器,處理器核也集成了對多媒體、壓縮、加密的專用指令模塊,幾乎所有的純數字電路邏輯,都已經集成到 Intel 處理器內部。
這難道不是一個 SoC -- System on Chip 嗎?無論什么樣的 SoC,主板和物理信號接口總還會是存在的,服務器級別的大容量內存目前也很難完全集成到芯片或封裝內部,所以我們看到的已經是一個高度集成、基于 SoC 處理器的服務器系統。
很顯然,“SoC 就是新的主板”的說法并不準確,而“用 SoC 代替主板上分立的功能組件”是一個早就發生了的事實,那么 Amit 提到的谷歌 SoC 創新到底指什么?
讓我們再看看 Amit 的博客文章,他提到了 2015 年開始的谷歌自研 TPU 芯片項目( Tensor Processing Unit ,面向 AI 加速,目前已經發展到第三代),2018 年谷歌的 VCU 項目(Video Coding Unit,面向視頻流加速處理),以及 2019 年的 OpenTitan 項目(開源安全芯片,基于 Titan 芯片),從這些項目中誕生的,恰恰是 Amit 所提到的“主板上分立的功能組件”,也就是獨立的功能芯片。
谷歌已經從 TPU 等芯片的大規模應用中嘗到了甜頭,結合谷歌的軟件和 AI 算法之后,目前谷歌翻譯、谷歌 Colab、谷歌圖像、部署在谷歌云上的各類客戶應用等都在大規模使用 TPU 芯片。
當這樣的功能組件芯片取得大規模應用的成功之后,谷歌下一步要干什么?當然是像過去 20 年業界一再發生的一樣,將這些新功能組件集成到處理器 SoC 內部,進一步降低成本和功耗并提高集成度。在通用處理器市場還牢牢掌握在 Intel 等廠商手中的情況下,谷歌必須考慮設計自己的 SoC 處理器來完成它的目標。
這就很清楚了:Amit 所指的 SoC 創新,并不是指簡單地用 SoC 電路去替代主板上多個分立功能單元,而是從谷歌的應用需求出發,超越現有的通用服務器 SoC 去定制符合特定應用需求的多樣化 SoC 處理器,我們可以稱之為“定制 SoC 處理器”。類似的,Nvidia 公司在 2019 年收購的 Mellanox,其長遠目標同樣是將 Mellanox 公司所創新的 SmartNIC 功能模塊集成進自己的新一代 SoC 處理器。同樣,亞馬遜、微軟、華為、阿里巴巴等云廠商也都已經或布局了自己的 SoC 芯片產品和研發團隊。
為什么這些系統產品巨頭們都把眼光投向了小小的芯片?因為未來的產品創新和競爭都會緊密圍繞定制 SoC 芯片展開,在一顆芯片或封裝內的完整系統才有最優化的性能和功耗,再加上跟軟件系統的緊密配合,會給系統產品廠商帶來最大的競爭優勢,這里最典型的例子就是芯片、硬件系統、操作系統直到應用系統全面開花的蘋果公司。跟我們過去已經習慣看到嵌入式系統領域有大量的定制 SoC 一樣,桌面電腦、云計算和服務器領域同樣會誕生更多的定制化處理器。
定制 SoC 處理器代表了整個芯片行業的未來:從應用系統需求誕生出創新的功能芯片,然后功能芯片被定制 SoC 處理器吸收進去,甚至新的創新功能被直接集成進 SoC 處理器,這個過程將會一再重復而且周期越來越快。同時,近年來逐漸放慢的通用處理器性能進步,也讓業界對定制 SoC 處理器的性能優勢要求逐漸放低,類似更貴的石油會推動新能源的發展是同樣的道理。但是,定制 SoC 會要求芯片設計周期和設計成本要求不斷優化,因為終端產品公司的創新是基于軟硬件協同的系統級優化,這種創新帶來的成本降低比深度優化芯片設計潛能更大,所以芯片快速、低成本地實現并部署到產品內更加重要。
上面提到的這些需求,對芯片設計和制造產業鏈提出了更高的要求,對芯片產業鏈上游的 EDA 廠商也提出了更高的要求。如何大幅改進目前的 EDA 流程,減少對人工投入的依賴,加速芯片設計流程,降低芯片設計成本,這正是中國 EDA 公司的機會。