DeepSeek 近日一連串的動作無疑在 AI 領域投下了一枚重磅炸彈。這家公司不僅在過去一周連續開放了五個 Infra 項目的源代碼,更是在開源周的最后一天,公布了 DeepSeek-V3/R1 推理系統的技術細節,這一舉動引發了業界對于其商業模式和技術實力的熱烈討論。
DeepSeek 的技術解讀揭示了其推理系統的核心優化目標:更大的吞吐,更低的延遲。為了實現這一目標,DeepSeek 采用了大規??绻濣c專家并行(Expert Parallelism / EP)技術。這種技術方案使得每個 GPU 只需要計算少量專家,從而降低延遲,同時通過增大 batch size 提高 GPU 矩陣乘法的效率,進而提升整體吞吐。
然而,EP 也帶來了復雜性,尤其是在跨節點傳輸和負載均衡方面。DeepSeek 通過設計合適的計算流程,使得傳輸和計算可以同步進行,從而隱藏傳輸的耗時。此外,針對大規模并行(包括數據并行和專家并行)帶來的負載均衡問題,DeepSeek 設計了針對 Prefill 和 Decode 階段的 Load Balancer,以確保每個 GPU 的計算負載、通信負載盡可能均衡。
DeepSeek 的開源周行動,最引人注目的莫過于其驚人的理論利潤率。根據 DeepSeek 官方給出的數據,如果所有 tokens 都按照 DeepSeek R1 的定價計算,理論上一天的總收入可達 562027 美元,而成本利潤率高達 545%。這意味著每投入 1 美元的成本,就能獲得 5.45 美元的利潤。這一數字無疑顛覆了許多人對于大模型推理服務成本結構的認知。
這一數據一經公布,迅速引發了社交媒體上的刷屏式討論。不少網友驚呼,如此高的利潤率是否意味著自己長期以來被其他大模型服務提供商“搶劫”了?有投資人更是將這一利潤率換算成年收入和估值,認為 DeepSeek 的商業效率理應支撐起一家估值 100 億美元的公司。
DeepSeek 以“價格屠夫”著稱已久。自 2024 年 5 月發布 DeepSeekV2 以來,DeepSeek 的模型服務價格通常只有行業其他模型的十分之一左右。長期以來,業界對于 DeepSeek 是否在虧本打價格戰一直存在質疑。此次開源周,特別是推理系統概述的公布,打消了這些疑慮。DeepSeek 通過技術創新,成功降低了推理成本,實現了高吞吐、低延遲,并最終獲得了令人難以置信的利潤率。
DeepSeek 的行動不僅影響了市場對于模型推理價格的預期,也為生態伙伴帶來了巨大的機遇。一位 AI 領域的投資人指出,DeepSeek 官方的技術解讀表明,云平臺和上下游通過部署 DeepSeek 的服務,理論上可以獲得很高的收益和利潤率。無論是對于提供在線推理,還是私有化部署等服務的供應商,這都是一個利好消息。
硅基流動創始人袁進輝也第一時間發表了自己的感受,認為 DeepSeek 官方披露大規模部署成本和收益,再次顛覆了許多人的認知。然而,他也指出,要充分利用 DeepSeek V3/R1 的優勢,需要時間來適配其模型架構。他認為,目前許多供應商還無法達到 DeepSeek 的水平,主要是因為 V3/R1 架構與其他主流模型差別太大,需要按照 DeepSeek 報告描述的方法才能達到最好的效率。
袁進輝進一步分析了 DeepSeek 采用如此獨特架構的可能戰略思考。他認為,DeepSeek 團隊可能是基于某種原因想到了這種模型結構,然后發現這種結構無論是訓練還是推理,都存在非常大的工程挑戰。DeepSeek 團隊最終選擇迎難而上,并成功實現了這一目標。
DeepSeek 在官方報告中也明確指出,DeepSeek-V3/R1 推理系統的優化目標是:更大的吞吐,更低的延遲。為了實現這一目標,DeepSeek 在硬件層面選擇了 H800 GPU,并在軟件層面采用了與訓練一致的精度,即矩陣計算和 dispatch 傳輸采用和訓練一致的 FP8 格式,core-attention 計算和 combine 傳輸采用和訓練一致的 BF16,最大程度保證了服務效果。
此外,DeepSeek 還實現了一套機制,可以根據白天和晚上的服務負荷動態調整推理節點的數量,從而提高資源利用率。根據 DeepSeek 公布的數據,在最近的 24 小時里,DeepSeek V3 和 R1 推理服務占用節點總和,峰值占用為 278 個節點,平均占用 226.75 個節點(每個節點為 8 個 H800 GPU)。
DeepSeek 的開源周,不僅展示了其強大的技術實力,也為其生態伙伴創造了巨大的商業機會??梢灶A見,隨著 DeepSeek 技術的進一步普及,模型推理的價格將越來越負擔得起,而服務提供方也將從中受益。
DeepSeek 的行動也引發了人們對于 AI 領域未來發展方向的思考。在模型能力日益強大的同時,如何降低成本、提高效率,將成為 AI 公司競爭的關鍵。DeepSeek 通過技術創新,成功實現了低成本、高效率,為其在未來的競爭中贏得了先機。
總之,DeepSeek 的開源周行動,不僅是一次技術展示,更是一次商業模式的革命。其驚人的理論利潤率,不僅顛覆了人們對于大模型推理服務成本結構的認知,也為 AI 領域的未來發展指明了方向。DeepSeek 的故事,或許才剛剛開始。