
丘孔报科技——每天科技新闻,热辣点评
互联网的世界每天瞬息万变,把握互联网,就是把握未来。
丘孔语论,带你一起,领略互联网的魅力。
187

深度求索即将发布下一代AI大模型DeepSeeker-R2,其参数量预计达到1.2万亿,较前代提升约一倍。该模型采用混合专家模型Moe架构,结合智能能控网络层优化,显著提升了高负载推理任务的性能表现,规模对标GPT-4 Turbo和Gemini 2.0 Pro等国际主流模型。
在硬件平台方面,DeepSeeker-R2基于华为昇腾910B芯片集群进行训练,FP16精度下实现512PF计算性能,昇腾芯片利用率达82%。测试数据显示,该算力约为英伟达A100训练集群的91%,同时单位推理成本较GPT-4降低97.4%,达到0.07美元/百万Token。
由于美国断供英伟达高端芯片,华为昇腾910B训练集群的应用进一步降低了对外部AI芯片的依赖。昇腾910C芯片已进入量产阶段,CloudMatrix 384超节点采用384颗昇腾910C芯片,或成为替代英伟达NVL72集群的方案,推动国产AI硬件自主化进程。
沪ICP备06026464号-4 网络文化经营许可证
沪网文[2014]0587-137号
信息网络传播视听许可证:0911603
©2011-2019 qingting.fm ALL Rights Reserved.
应用名称:蜻蜓FM | 开发者:上海麦克风文化传媒有限公司