马斯克的 AI 公司 xAI 已正式公开 Grok-1 源代码
ChainCatcher 消息,马斯克的人工智能公司 xAI 宣布开放其 3140 亿参数混合专家模型 Grok-1 的权重和架构。Grok-1 是一个从头开始由 xAI 训练的大型语言模型,采用混合专家模型架构,其中 25% 的权重在给定令牌上处于活跃状态。该模型的基本模型权重和网络架构现已根据 Apache 2.0 许可证开放。
据悉,Grok-1 的预训练阶段已于 2023 年 10 月结束,目前发布的是原始基础模型检查点,未针对任何特定应用进行微调。