DeepSeek原理与项目实战
基本信息

语言: | 中文 |
作者: | 未来智能实验室 |
出版社: | 人民邮电出版社 |
发布时间: | 2025年3月 |
页数: | 324 |
ISBN: | 9787115665584 |
内容简介
DeepSeek 是一种基于 Transformer 架构的生成式 AI(Artificial Intelligence)大模型,融合了MoE 架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型 DeepSeek-V3 的核心技术及其在实际开发中的深度应用。
全书分三部分共12章,涵盖理论解析、技术实现和应用实践。第一部分从理论入手,详细解析了Transformer 与注意力机制、DeepSeek-V3 的核心架构与训练技术等内容,并探讨了 Scaling Laws 及其在模型优化中的应用。第二部分聚焦于大模型初步体验、开放平台与API 开发、对话生成与代码补全的实现,以及函数回调与缓存优化(Visual Studio Code),帮助读者快速掌握关键技术的基础理论和落地实践。第三部分则通过实际案例剖析DeepSeek在Chat类客户端、智能 AI 助理、VS Code编程插件等多领域中的实用集成开发,展示了开源大模型技术在工业与商业场景中的全面应用。
本书通过深度讲解与实用案例相结合的方式,帮助读者理解 DeepSeek 大模型从原理到开发的完整流程,学习新技术的实现方法与优化策略,全面提升在大模型领域的理论素养与开发能力。本书适合生成式 AI 技术研究者、软件开发工程师、数据科学家,以及希望快速掌握大模型技术并将其应用于实际场景的 AI 技术爱好者和高校师生阅读。
下载
如果上方的下载按钮无法下载,可以使用此处的下载地址手动跳转。
tK91
本站所有资源均经过人工检查,确保质量。每一个都是互联网上能收集到的质量最好的版本。对于多个版本的书籍,一般只收录最新版本。
本站所有资源均免费,如果您觉得还行,请分享给更多的人。如果您有任何问题,或者想贡献更优质的版本,可以点击下方【建议/报告问题】按钮提交。