1、封面介绍
2、出版时间
2025年6月
3、内容介绍
本书以通俗易懂、大量图解的方式剖析了DeepSeek的底层技术。全书分为3章和附录,第1章详细分析推理大模型的范式转变,即从“训练时计算”到“测试时计算”;第2章解读DeepSeek-R1的架构——混合专家(MoE),第3章展示DeepSeek-R1详细的训练过程及核心技术,涵盖基于GRPO的强化学习等;附录分享DeepSeek开源周活动。
4、推荐理由
本书适合大模型从业人员和对大模型底层技术感兴趣的读者。书中通过丰富的图解将复杂的技术解释得简单、清晰、通透,是学习大模型技术难得一见的参考书。
5、作者简介
Jay Alammar(杰伊·阿拉马尔)
Cohere总监兼工程研究员,知名大模型技术博客Language Models & Co作者,DeepLearning.AI和Udacity热门机器学习和自然语言处理课程作者。
Maarten Grootendorst(马尔滕·格鲁滕多斯特)
IKNL(荷兰综合癌症中心)高级临床数据科学家,知名大模型技术博客博主,BERTopic等开源大模型软件包作者(下载量超过百万次),DeepLearning.AI和Udacity课程作者。
Jay & Maarten撰写的图解系列文章广受赞誉,累计吸引了数百万专业读者的目光。其中,Jay 的“The Illustrated Transformer”“The Illustrated DeepSeek-R1”、Maarten的“A Visual Guide to Reasoning LLMs”在全网热度极高。
Jay & Maarten的第一部作品《图解大模型:生成式AI原理与实战》(Hands-On Large Language Models)是业内广受赞誉的经典。《图解DeepSeek技术》是Jay & Maarten的第二部作品,人民邮电出版社图灵全球独家发布,是解读DeepSeek原理与训练的宝贵读物。
6、下载链接
本电子书由热心网友提供,可以提供下载,下载方式请移步:http://www.hbase.cn/archives/1147.html