9月25日,在2024百度云智大会上,百度智能云宣布将百舸AI异构计算平台全面升级至4.0版本。升级后的百舸,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型训练、模型推理四大方面,为企业提供“多、快、稳、省”的AI基础设施。
为了解决算力资源短缺的问题,百舸4.0对“多芯混训”能力进行了重点升级,实现了在万卡规模集群上95%的多芯混合训练效能,达到业务最领先水平。
在集群部署环节,升级后的百舸能够实现工具层面的秒级部署,将万卡集群运行准备时间从数周最快缩减至1小时,极大地提升部署效率,缩短业务上线周期。
针对大模型训练过程中故障频发的问题,百舸4.0全面升级了故障检测手段和自动容错机制,可以有效降低故障发生频次,大幅减少集群故障处置时间,在万卡集群上实现了超过99.5%的有效训练时长。
在模型推理上,最重要的是速度和成本。现在长文本推理逐渐成为主流,百舸4.0整体上做了推理速度和成本优化,长文本推理效率提升了1倍以上。(李记)
北京最大电竞馆“微博IN”今日启用
经过中建二局历时两年的改造,北京朝阳公园内原为2008年北京...(0 )人阅读时间:2025-03-12Windows 11任务栏电池图标全新设计改进细节曝光
3月8日的消息显示,微软在3月4日举办的WindowsIns...(0 )人阅读时间:2025-03-12波音Starliner飞船技术问题修复进展及发射计划调
3月8日,美国国家航空航天局(NASA)商业载人航天计划的负...(0 )人阅读时间:2025-03-12武汉出台天河机场净空和电磁环境保护管理办法
3月8日,据湖北武汉当地媒体报道,自3月1日起,武汉天河机场...(0 )人阅读时间:2025-03-12