DeepSeek-R2发布在即,参数量翻倍,华为昇腾芯片利用率达82%!

00:00
02:04
主播信息
叨哥

叨哥

人人都是蜻蜓主播,欢迎关注叨哥
关注
情爱故事
1150
成年人的世界本以为能够风花雪月,却发现全都是柴米油盐酱醋茶!忧伤总多过欢笑,复杂总多过简单!听别人的故事,悟自己的人生,带你共同领略家庭、婚姻、感情、婆媳关系、夫妻相处之道!让我们做生活的主人,拥有幸福的能力!
民间故事
759
每一个故事都来自坚实的泥土,都带着泥土的芬芳和山花扑鼻的香气。通过一个又一个美丽动人的故事去荡涤人们心灵的尘埃,使人们在获得阅读的愉悦之时,心灵也同时得到了净化。
车来车往
211
在这里,汽车的世界跃然眼前,每一缕资讯都散发着新鲜油墨的香气。专业的笔触,如同匠人雕琢,将汽车评测细细剖析,展现其内在的魅力与灵魂。而那些好玩的汽车活动,则如同星辰点缀夜空,为这趟旅程增添无限乐趣与惊喜。不必四处寻觅,你所渴望的新鲜汽车资讯、深度专业评测、趣味盎然的活动,皆汇聚于此,宛如一场盛大的汽车盛宴,只待你来,共赴这场速度与激情的邀约。在这里,每一刻都是探索的开始,每一次点击都是新知的启航!
APP内查看主播
节目详情

# DeepSeeker-R2模型参数信息

# 混合专家模型Moe架构

# 智能能控网络层优化

# 华为昇腾910B芯片集群

# 昇腾芯片利用率82%

# 单位推理成本降低97.4%

# 国产AI硬件自主化进展

深度求索即将发布下一代AI大模型DeepSeeker-R2,其参数量预计达到1.2万亿,较前代提升约一倍。该模型采用混合专家模型Moe架构,结合智能能控网络层优化,显著提升了高负载推理任务的性能表现,规模对标GPT-4 Turbo和Gemini 2.0 Pro等国际主流模型。
在硬件平台方面,DeepSeeker-R2基于华为昇腾910B芯片集群进行训练,FP16精度下实现512PF计算性能,昇腾芯片利用率达82%。测试数据显示,该算力约为英伟达A100训练集群的91%,同时单位推理成本较GPT-4降低97.4%,达到0.07美元/百万Token。
由于美国断供英伟达高端芯片,华为昇腾910B训练集群的应用进一步降低了对外部AI芯片的依赖。昇腾910C芯片已进入量产阶段,CloudMatrix 384超节点采用384颗昇腾910C芯片,或成为替代英伟达NVL72集群的方案,推动国产AI硬件自主化进程。

展开
大家都在听
评论(0条)
快来抢沙发吧!
打开蜻蜓 查看更多