AI前沿：从数学推理到记忆注入-AI可可AI生活-蜻蜓FM听科技

本期播客精华汇总

Phi-4-Mini-Reasoning: Exploring the Limits of Small Reasoning Language Models in MathPhi-4-Mini-Reasoning：探索小型数学推理语言模型的极限通过四阶段训练（大规模蒸馏、微调、偏好优化、强化学习），仅38亿参数的Phi-4-Mini-Reasoning在数学推理上超越70亿-80亿参数模型，揭示小模型需“量体裁衣”的训练策略，反直觉地发现朴素高质量数据可能有害。

ParamΔ for Direct Weight Mixing: Post-Train Large Language Model at Zero Cost直接权重混合的 ParamΔ：零成本训练后的大型语言模型ParamΔ通过简单权重差值加法，将后训练能力零成本迁移到新基座模型，性能达官方版的95%，为开源社区提供高效模型更新方案，揭示参数空间的代数结构潜力。

Model Connectomes: A Generational Approach to Data-Efficient Language Models模型连接组：一种面向数据高效的语言模型的方法受生物进化启发，提出“模型连接组”作为稀疏先验，仅用1亿词数据即可实现高性能语言学习，展现结构先验在数据效率和人脑对齐上的潜力。

Memorization and Knowledge Injection in Gated LLMs记忆与门控 LLMs 中的知识注入MEGa框架通过门控LoRA模块注入事件记忆，显著缓解灾难性遗忘，接近RAG性能，展示模块化记忆和内部回忆（iRAG）在持续学习中的前景。

AdaR1: From Long-CoT to Hybrid-CoT via Bi-Level Adaptive Reasoning OptimizationAdaR1：从长 CoT 到混合 CoT 通过双级自适应推理优化AdaR1通过融合长短CoT模型和双层偏好优化，实现自适应推理，推理长度减半而准确率仅微降，展现“因题施策”的高效推理潜力。

完整推介：https://mp.weixin.qq.com/s/MyQN09CEBe59dbKcL7YEQg

AI产品观察

这是一档由李自然和其 Bootloader 团队制作的节目，从作战第一线的产品视角，探讨最前沿的人工智能技术及其在全球市场中的应用。 Bootloader 是一家研究驱动的 AI 应用出海公司。致力于将前沿的 AI 技术转化为用户可用的产品，并实现商业化。同时总结经验为一套方法论，赋能其他 AI 应用开发者。【合作/交流机会】 1. 产品需要出海营销增长服务的开发者们：我们团队把自己产品 GTM 的经验梳理成了清晰的 SOP，并有专业的团队提供服务。欢迎有意向的开发者联系我们。 2. 想要加入团队的年轻人：我们持续招聘 AI 产品海外运营人才、AI 产品管培生。（JD见单集介绍链接） 3. 有实战经验的营销/产品/行业专家：希望和垂直细分领域、有独特洞见和技能的专家合作交流，合作方式灵活。 4. 想要低成本投资 AI 产品的投资人：欢迎认同我们愿景、希望参与 AI 行业的投资人与我们联系。 5. 加入听友群：与更多人一起交流 AI 动态。【联系方式】以上合作/交流需求请联系 AI小助手微信：aixiaozhushou66。

75期

AI前沿：从数学推理到记忆注入

爱可可爱生活

本期播客精华汇总