马斯克突发Grok 1.5

据官方介绍，Grok 1.5采用分布式训练架构，使用Rust、JAX+Kubernetes构建。

量子位

2024-03-29 13:25 微信公众号：量子位丰色西风

+ 关注

就在刚刚，马斯克Grok大模型宣布重大升级。

难怪之前突然开源了Grok-1，因为他有更强的Grok-1.5了，主打推理能力。

来自xAI的官方推送啥也没说，直接甩链接。主打一个“字少事大”

新版本Grok有啥突破？

一是上下文长度飙升，从8192增长到128k，和GPT-4齐平。

二是推理性能大幅提升，数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4。

消息一出，评论区立刻就躁起来了。

具体跑分结果如何，咱们立马来看。

Grok-1.5来了

首先，对于上下文窗口。

这次是一把直接提升到之前的16倍，来到128k量级。

这也就意味着Grok可以处理更长和更复杂的提示，同时保持其遵循指令的能力。

在“大海捞针”（NIAH）测试中，Grok-1.5在128K token的上下文中*检索嵌入的文本。

整个图一水儿的蓝色（100%的检索深度）：

其次，推理方面。

Grok-1.5处理编程和数学相关任务的能力大幅提升，全面超越Grok-1、Mistral Large、Claude 2。

数学方面，Grok-1.5在MATH基准测试上得分50.6%，超越中杯Claude 3 Sonnet；GSM8K上得分90%。

编程方面，Grok-1.5在HumanEval基准测试上得分74.1%，超越中杯Claude 3 Sonnet、Gemini Pro1.5、GPT-4，仅次于大杯Claude 3 Opus。

看起来，Grok这次的实力也是不可小觑。

Grok系列与其他大模型相比还有一个特色，不使用通用的Python语言+Pytorch框架。

据官方介绍，Grok 1.5采用分布式训练架构，使用Rust、JAX+Kubernetes构建。

为了提高训练可靠性和维持正常运行时间，团队提出了自定义训练协调器，可自动检测到有问题的节点，然后剔除。

除此之外，他们还优化了checkpointing、数据加载和训练重启等流程，*限度地减少故障停机时间。

这，才速速有了现在的Grok 1.5～

更多信息官方也暂时还没有披露。

可以确定的是，新版本未来几天会先推送给早期测试者。并按照“老规矩”，很快将在平台上线。

网友们表示：Grok进步真的相当迅速。

不提别的，Grok新版本各指标已经全面超越Claude 2。而xAI成立仅一年，只比Anthropic落后9个月。因此：打赌12个月后，xAI完全有可能成为*。

还有人评价更高，认为马斯克这是发了另一个“GPT-4等效模型”，喊着：OpenAI搞快点啊。

你期待新版本的Grok吗？

打开投资界APP 阅读全文

【本文由投资界合作伙伴微信公众号：量子位授权发布，本平台仅提供信息存储服务。】如有任何疑问题，请联系（editor@zero2ipo.com.cn）投资界处理。

马斯克大模型 Grok AI行业

AI数据总览

5776起
融资事件
1040.20亿元
融资总金额
2866家
企业
2062家
涉及机构
128起
上市事件
1.06万亿元
A股总市值

智美星辰智美星辰（海宁）科技有限公司
天使轮数千万人民币
2024-04-29
投资方： 紫金港资本

沐言智语北京沐言智语科技有限公司
Pre-A+轮 1.2亿人民币
2024-04-28
投资方： 高瓴资本

火眼消防火眼消防技术有限公司
A轮千万级人民币
2024-04-28
投资方： 相城金控 苏州高铁新城

爱诗科技北京爱诗科技有限公司
A+轮超亿人民币
2024-04-24
投资方： 蚂蚁集团

Perplexity AI Perplexity AI lnc.
B+轮 6300万美元
2024-04-24
投资方： 英伟达 贝索斯 Dylan Field 丹尼尔·格罗斯 Garry Tan

马斯克突发Grok 1.5

量子位

相关资讯

马斯克加入了开源大模型阵营

湖北前首富，超了马斯克

马斯克为什么一定要开源AI？

AI数据总览

最新资讯

2023，一级市场最火是AI

线下母婴店，入局「大逃杀」

新世界地产前海再添新地标

热门TOP5热门机构|VC情报局