国科网

2024-11-21 21:33:34  星期四
立足国科融媒,服务先进科技
马斯克 xAI 推出 Grok-1.5 大语言模型!升级推理能力

点赞

0
发布时间:2024年05月28日 浏览量:231次 所属栏目:人工智能 发布者:田佳恬

   3 月 29 日消息,马斯克旗下人工智能公司xAI今天在官方博客中宣布,即将正式推出Grok-1.5 大语言模型。

  据介绍,Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。

_url=http%3A%2F%2Fdingyue.ws.126.net%2F2024%2F0329%2F3091007aj00sb39cp00bgd0014000hng

  在官方测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中竞赛问题。此外,它在评估代码生成和解决问题能力的 Humaneval 基准测试中得分为 74.1%。

  据介绍,Grok-1.5 构建在基于 JAX、Rust 和 Kubernetes 的自定义分布式训练框架之上。自定义训练协调器可确保自动检测到有问题的节点并将其从训练作业中剔除。xAI还优化了检查点、数据加载和训练作业重新启动,以最大限度减少发生故障时的停机事时间。

分享说明:转发分享请注明出处。

    热点图讯
    最新图讯
    相关图讯
    网站简介  |   联系我们  |   广告服务  |   监督电话
    本网站由国科网运营维护 国科网讯(北京)技术有限公司版权所有  咨询电话:010-88516927
    地址:北京市海淀区阜石路甲69号院1号楼1层一单元114
    ICP备案号:京ICP备15066964号-8   违法和不良信息举报电话:010-67196565
    12300电信用户申诉受理中心   网络违法犯罪举报网站   中国互联网举报中心   12321网络不良与垃圾信息举报中心   12318全国文化市场举报网站
    代理域名注册服务机构:阿里巴巴云计算(北京)有限公司