马斯克xAI推出Grok-1.5大语言模型 可处理128k上下文

IT之家今日(3月29日)消息,马斯克旗下人工智能公司xAI今天在官方博客中宣布,正式推出Grok-1.5大语言模型。

Grok-1.5具有改进的推理能力和128k的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5将在未来几天内在𝕏平台上向早期测试人员和现有的Grok用户推出。

在官方测试中,Grok-1.5在MATH基准上取得了50.6%的成绩,在GSM8K基准上取得了90%的成绩,这两个数学基准涵盖了广泛的小学到高中竞赛问题。此外,它在评估代码生成和解决问题能力的HumanEval基准测试中得分为74.1%。

附测试对比表如下:

长上下文理解方面,Grok-1.5能够在其上下文窗口内处理多达128ktokens的长上下文。这使得Grok的内存容量增加到之前上下文长度的16倍,从而能够理解更长文档中的信息。

据介绍,Grok-1.5构建在基于JAX、Rust和Kubernetes的自定义分布式训练框架之上。自定义训练协调器可确保自动检测到有问题的节点并将其从训练作业中剔除。xAI还优化了检查点、数据加载和训练作业重新启动,以最大限度地减少发生故障时的停机时间。

05072024

苹果:禁止在Vision Pro发布带有真实枪械模型游戏

今日(5月7日),一位网络昵称为AkDebuging的Vision Pro软件开发者在Reddit论坛发文表示苹果将不允许开发者在该头戴式“空间计算”显示设备上发布带有真实枪械模型的游戏。 苹果官方表示:“禁令的原因是该应用程序包含鼓励或宣扬非法行为的逼真武器图...

04262024

讯飞星火大模型V3.5春季上新 V4.0 6月27日发布

IT之家今日(4月26日)消息,科大讯飞今日官宣,讯飞星火大模型 V3.5 春季上新,科大讯飞董事长刘庆峰发布讯飞星火大模型一系列新功能。 刘庆峰表示,目前星火大模型通用长文本能力,包括长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文...

04172024

迷你世界怎么使用模型工作台

迷你世界里面有很多的道具可以去使用,今天给大家带来的是使用模型工作台方法,还有很多的小伙伴不清楚要怎么去使用,那么下面就是具体的方法. 迷你世界使用模型工作台方法 首先,我们打开创造模式或者开发者模式,打开背包工具栏中找到我们的道具...

03062024

原神怪物模型消失怎么办

游戏原神中,玩家会在战斗时遇到怪物的模型丢失问题。这个bug手机玩家尤为严重,而且主要是纯水精灵经常会触发这个bug。该bug的解决方法为调整游戏内的视角,一定要调整至视角与画面平行,这样就能看到敌人的模型了。如果玩家是在靠近怪物之后,怪物的模...

01172024

OpenAI新动作 收集民调确保AI大模型与人类价值观保持一致

人工智能领域的佼佼者 OpenAI 于美国当地时间周二在其博客上宣布,他们正在组建一个名为“集体对齐”(Collective Alignment)的全新团队。 这个团队主要由研究人员和工程师构成,将专注于设计和实施收集公众意见的流程,以帮助训练和塑造其人工智能模...

01172024

“书生・浦语”2.0大语言模型开源 200K上下文

IT之家今日(1月17日)消息,商汤科技与上海 AI 实验室联合香港中文大学和复旦大学今日发布了新一代大语言模型书生・浦语 2.0(InternLM2)。 据介绍,InternLM2 是在 2.6 万亿 token 的语料上训练得到的。沿袭第一代书生・浦语(InternLM)设定,In...

01162024

这次真是鲁迅说的 东海模型上架官方授权鲁迅先生可动模型

鲁迅先生的名言名句不仅对他所处的时代产生了重要影响,对现代互联网也有着重要启示。 近日由台湾模型店万年-东海模型出品,模型工作室猿行师与TO FUTURE工作室以及鲁迅文化基金会联合推出了“1/12鲁迅可动模型”。 该模型获得了鲁迅文化基金会(以...

01112024

俗称“那些游戏”PS4/PS5版1月11日发布,NS・Steam版追加6种语言

由株式会社D3 Publisher发行的《我们把似曾相见的「那些游戏」都做成了火柴人,可是你又能否成功过关呢?》的PlayStaiton®4及PlayStation® 5版于今日(1月11日)开放下载。 另外、已经上架的Nintendo Switch版和Steam®版将在现有日语、英语、繁体中 &...