纯 C 语言训练系统:把翻译层全部扔掉
马斯克在 X 发帖:SpaceX 已几乎写完自研 AI 训练系统 1.0 版本,用纯 C 语言,精确对应 22 万块 GB300 芯片,大量使用流水线并行,尽可能贴近裸金属。对于大型训练任务,相比 JAX 潜在速度提升超过一个数量级(10 倍以上)。
为什么要扔掉 JAX? JAX 是谷歌为自家 TPU 和中小规模任务优化的框架,SpaceX 要跑的是英伟达 GPU 上的超大规模训练,两边需求根本不是一回事。纯 C 直接编译成仅次于汇编的机器码,中间没有翻译层,等于把每一条指令直接说给硬件听。
如果 10 倍成真意味着什么:
注意: 马斯克用的词是「潜在」提升,不是已跑出来的成绩。能不能兑现要等 benchmark 说话。
这不是模型的突破,是地基的突破——地基快 10 倍,所有后续模型都跟着受益。背后的根源:SpaceX 几十年写火箭控制软件,写贴着硬件的极致可靠底层代码,是刻在骨子里的本能。
Colossus 租给 Anthropic 的真实条款
外面传言说是签到 2029 年的长期合同。马斯克本人澄清——真实条款:初始租期 180 天,之后任意一方提前 90 天通知即可取消,而且是 SpaceX 主动要求的短期安排。
逻辑:平时算力闲着,租给 Anthropic 赚现金流;一旦 SpaceX 自己的纯 C 训练系统跑通,需要大规模训练 Grok,半年后随时收回。赚对手的钱,养自己的扩张,不放弃随时收手的控制权。
德州超级工厂 Cortex 2 储能站
现场观察者报告:又有 18 个 Megapack 储能柜运到现场,8 个已吊装到永久桩基。最终整个德州超级工厂三个位置加起来,接近 400 个 Megapack,专门服务 AI 训练产生的剧烈用电波动。
Megapack 由特斯拉自己造,从电到算力到 AI 模型到 FSD 和 Optimus 产品,全链条自有——这是别人复制不了的垂直整合优势。