2023 年 5 月,字節跳動負責 RISC-V 以及服務器芯片業務負責人盧山從字節離職創業,成立藍芯算力,據稱其主要業務方向仍是 RISC-V 數據中心 CPU(中央處理器),目前正在進行首輪融資,投前估值超過 1 億美元。
芯片行業近兩年并不缺乏各種大廠芯片團隊「獨立」,尋求獨立融資,甚至更進一步商業化發展的故事:百度已經于 2021 年將旗下芯片業務分拆成為獨立的昆侖芯科技有限公司,阿里高管也曾公開表示對于平頭哥分拆/獨立融資持開放態度。
(資料圖)
但這一次,藍芯算力似乎并不是另一個「降本增效」自負盈虧的故事:根據天眼查的公開數據顯示,藍芯算力(深圳)于 2023 年 5 月 23 日成立,注冊資本為 980 萬人民幣,法定代表人為盧山,盧山名下的兩家全資控股公司共占有藍芯算力的 89.8% 股份。
在進入字節之前,盧山曾在英特爾與高通任職,從事 SoC/CPU 芯片方向的設計開發工作。加入字節跳動之后,盧山也一直在圣迭戈辦公室任職,主導芯片計劃中 RISC-V 指令集服務器芯片相關研發工作。根據領英主頁關于這段工作內容的介紹,他在字節跳動「負責數據中心集成電路芯片設計工作」。截至發稿,盧山的領英主頁并未更新他的下一步 —— 藍芯算力的計劃。但據相關接近字節芯片業務的人士透露,盧山本人已經回國,為藍芯算力的下一步融資做準備。
就目前信息來看,藍芯算力似乎與字節跳動保持了一段微妙的距離,至于未來藍芯算力是否會接受字節跳動投資,或是藍芯算力在芯片研發上與字節跳動展開相關合作。《電廠》記者向字節跳動詢問此事,對方拒絕評論,并表示「目前沒有可以披露的相關信息」。
字節的芯片之路
字節跳動入局芯片領域的時間,相比阿里、百度等公司要晚一些:在 2018 年,中興被美國商務部禁運之際,字節跳動副總裁楊震原曾表示:
也是在此之后,盧山加入了字節跳動字節跳動圣迭戈辦公室尚在籌建中的芯片團隊,向字節芯片團隊負責人王劍匯報。
但直到 2020 年下半年 —— 同時也是全球芯片供應鏈受疫情沖擊最嚴重的階段,字節才最終啟動了自研芯片項目:據《晚點 LatePost》報道,字節跳動從 2020 下半年開始組建芯片研發團隊,到 2022 年,字節已經至少啟動了四個芯片項目,包括 AI 芯片、FPGA NIC 項目以及服務器芯片/RISC-V 項目,后兩個項目的負責人正是盧山。
幾乎所有在線服務平臺,都需要巨量的服務器芯片用于構建「基礎設施」,巨大的在線流媒體數據傳輸量,以及視頻編解碼,云端推理加速等場景,都迫使廠商不斷購買海量的服務器芯片來維持全球各地的自建數據中心正常運行:根據 Alphabet 財報公開的數據顯示,Google 每季度都要從市場中采購超過 30 萬顆服務器芯片,用于包括 Google Cloud 以及 YouTube 等業務。
這樣的大單不僅引來高通、英特爾等巨頭的爭奪,也促使在線服務巨頭紛紛將自研服務器芯片作為「第三選擇」;作為擁有 Tiktok、抖音等巨型平臺的字節跳動,即使一直有著「重算法、輕算力」的傳統,也不得不重視服務器芯片的自研:對于服務器芯片用量巨大的字節跳動來講,自研芯片不僅意味著能夠減少硬件成本,與字節系軟件服務實現更好地協同,還意味著能更方便地按照需求控制供應鏈。
但截至 2023 年,字節跳動的芯片研發團隊僅有約 300 人左右,這個團隊規模相比阿里、華為等國內服務器芯片廠商普遍 2000 - 4000 人的規模,要低出一個數量級。 但仍比同樣入局芯片行業的騰訊要高出一個數量級:在不同的經營模式之下,騰訊選擇了「設計+聯合研發」的路徑,芯片相關團隊的人數只有 60 余人。
團隊規模的巨大差異,也意味著字節的自研芯片之路采用了更接近騰訊的模式,同時刻意避免將芯片直接商業化,將使用范圍控制在「自產自銷」,根據自身使用需求來定義設計,也能更好的控制研發成本。
「如果自研芯片過于高調,可能會對(字節跳動服務器芯片)現在的合作關系造成較大的影響」一位芯片行業從業者對《電廠》記者表示,字節的在線服務體量決定了其有能力僅靠自有設施需求支撐起自研服務器芯片的發展,也更適合開發專用芯片。
字節跳動也很少對外公開過任何自研芯片的相關進展:最近一次公開在公開場合介紹相關進展是在 2022 年,楊震原稱字節目前并未在研發 CPU、GPU 等通用芯片,自研芯片主要字節跳動自身的視頻編解碼、云端推理加速等場景,同時也提到了字節「正在與供應商合作探索 RISC-V 架構芯片在云端的使用」。同時還重申字節并無關于通用芯片的商業計劃。
但這仍無法解釋服務器芯片進展緩慢的原因:2022 年,據《晚點 LatePost》報道,字節自研 AI 芯片「進展迅速」,第一代可能已經到流片階段,部分消息來源表明已經到了「灰度測試」階段。但盧山負責的服務器芯片領域,卻一直沒有相應的進展傳出,甚至有數個未經證實的消息來源表示「字節服務器芯片項目受阻」。
但無論如何,字節都沒有在此之后公開發布任何自研芯片產品的實際運用。也從未披露過服務器芯片領域的研發進展,而距離 2020 年已經過去近三年,對比包括平頭哥、百度、騰訊在內,采用不同研發模式的芯片廠商,第一代量產產品的問世基本都在 3-4 年之間,但如今字節的進度明顯滯后,這也側面證實了傳聞中「字節跳動自研服務器芯片受阻」的傳聞。
或許在字節自研服務器芯片項目的受阻,也是盧山最終出走字節,選擇獨立在芯片領域創業的原因。
為什么會押注RISC-V ?
RISC-V 是一種指令集,和 x86 以及 ARM 一樣,定義了芯片和軟件的設計規范。我們日常更加熟悉的 x86 被廣泛應用于高性能工作站以及數據中心處理器中,而 ARM 屬于精簡指令集,在很長一段時間內都主要應用在手機以及車機領域。
但隨著技術趨勢的逐漸變化,以往的精簡指令集也獲得了成為高性能芯片指令集的機會,蘋果已經全線使用 ARM 芯片替代了此前的 Intel x86 架構芯片,也有越來越多 ARM 架構 CPU 走進了數據中心芯片領域,而 RISC-V 與 ARM 同屬精簡指令集,也在近兩年獲得不少開發團隊的青睞。
但曾經被視為整個芯片供應鏈中最穩定一環的 ARM 公司本身,如今也不再穩定:不僅在風雨飄搖的貿易戰被多方擔心是否會被迫遵守美國出口管制,也伴隨著英偉達計劃收購 ARM 而被卷入各種爭議, ARM 再也不是曾經廠商眼中的穩定、中立、可靠的象征。
這也讓更多芯片廠商將眼光投向了 RISC-V,盧山所創立的藍芯算力,選擇的也是這個研發方向,希望基于 RISC-V 指令集,設計能用于數據中心服務器的通用 CPU。
即便指令集與芯片性能無關,作為服務器芯片的選擇,RISC-V 指令集目前雖然有著一些 ARM 所不具備的優勢,但真正影響商業公司做出選擇的往往是指令集的生態建設:過去有不少中國芯片廠商在發力 RISC-V 生態領域,推動著 RISC-V 生態走向成熟,平頭哥發布的首款自研通用服務器芯片 —— 倚天 710,所采用的也 RISC-V 指令集。
平頭哥甚至成為了推動 RISC-V 生態建設的重要參與者:2023 年 1 月,Google 官方宣布 Android 系統正式支持 RISC-V 指令集,在可以預期未來還將成為與能與 ARM 平起平坐的「一級平臺」。
但短期內,RISC-V 還難以在數據中心芯片、尤其是通用 CPU 領域與 ARM/x86 相提并論「目前 RISC-V 指令集更多機會還集中于單片機以及物聯網設備,在數據中心芯片市場中還很難與 x86 以及 ARM 競爭」這位芯片行業分析人士對《電廠》記者表示,現在談論 RISC-V 全面成為「服務器芯片國產替代」還為時尚早,但 RISC-V 仍然有機會在用時間換空間,通過長期的發展贏得服務器芯片市場。
字節芯片,何去何從?
目前,即使盧山已經出走字節獨立創業,但字節芯片團隊仍然維持著招聘的節奏:相關求職軟件中仍能找到字節芯片團隊關于前端設計、SoC 驗證、模型性能分心,以及芯片 DFT 工程師等職位的 HC。
除了自有芯片團隊的組建,字節跳動同時也一直在外部尋找合適的芯片公司投資標的:過去三年字節連續投資了數家芯片企業,既有同屬 RISC-V 領域的公司睿思芯科,也有數據中心芯片公司云脈芯聯,以及 GPU 芯片獨角獸摩爾線程。
除了服務器芯片之外,字節其他已經啟動的芯片部門也都有正常進展,無論是用于優化推薦算法的 AI 芯片,還是用于短視頻處理需求的視頻編解碼芯片,在字節內部都有著足夠龐大的使用需求,這也決定了字節并不會輕易放棄自研芯片業務;反之也不會為此加速擴張團隊。以相對較小的投入,滿足內部對于芯片的使用需求同時提升效率。仍然會是當前一段時間內字節自研芯片業務的主要狀態。
關鍵詞: