AI前沿:从数学到感知解锁模型的“深度思考”

00:00
08:30
主播信息
爱可可爱生活

爱可可爱生活

Nice Day!
关注
AI可可AI生活
156
来自 @爱可可-爱生活 的第一手AI快报,用最通俗的语言,聊最前沿的人工智能科研进展~ #人工智能# #科技前沿#
APP内查看主播
节目详情

今天的五篇论文展示了AI在推理、效率和理解上的突破:

  1. Learning to Reason under Off-Policy Guidance:提出LUFFY框架,通过外部高质量推理轨迹提升AI数学推理能力,泛化性强,平均提升7%。
  2. Efficient Pretraining Length Scaling:PHD-Transformer通过智能管理KV缓存,实现高效预训练长度缩放,性能提升1.5%-2%,推理速度几乎不变。
  3. MAGIC: Near-Optimal Data Attribution for Deep Learning:MAGIC方法精准预测训练数据对模型的影响,相关性高达0.96,助力模型调试和可解释性。
  4. Exploring How LLMs Capture and Represent Domain-Specific Knowledge:发现大型语言模型在预填充阶段形成领域特定轨迹,用于智能路由,准确率提升12.3%。
  5. LongPerceptualThoughts: Distilling System-2 Reasoning for System-1 Perception:通过合成复杂推理数据,视觉-语言模型学会深度推理,视觉任务提升3.4分,文本推理也意外提升。

完整推介:https://mp.weixin.qq.com/s/0IlcYwqQ-GAgZDgh5TCnNQ

展开
大家都在听
评论(0条)
快来抢沙发吧!
打开蜻蜓 查看更多