分类 DeepSeek技术研究 下的文章


撰写于:  浏览:8 次  分类:DeepSeek技术研究
1、封面介绍 2、出版时间2025年6月3、内容介绍本书是一本全面介绍开发与应用DeepSeek大模型的实战指南,旨在帮助读者全面掌握大模型的技术与应用。本书首先介绍DeepSeek的核心概念、功能及未来发展方向,随后深入探讨大模型部署的硬件要求、量化技术、推理速度优化等关键问题,并详细介绍Transforme架构和混合专家模型的理论基础。接[...]

撰写于:  浏览:8 次  分类:DeepSeek技术研究
1、封面介绍 2、出版时间2025年6月3、内容介绍本书以通俗易懂、大量图解的方式剖析了DeepSeek的底层技术。全书分为3章和附录,第1章详细分析推理大模型的范式转变,即从“训练时计算”到“测试时计算”;第2章解读DeepSeek-R1的架构——混合专家(MoE),第3章展示DeepSeek-R1详细的训练过程及核心技术,涵盖基于GRPO[...]

关注公众号,感悟技术与人生

飞燕网
一个踏实、严谨的网站!

专注于PyTorch、强化学习和大模型技术

    友情链接