



当前,DeepSeek 模型在多个领域的部署应用取得显著进展,其技术不断迭代升级,应用场景日益丰富,为各行业带来了新的发展机遇。
DeepSeek 由杭州深度求索人工智能基础技术研究有限公司研发,该公司成立于 2023 年 7 月,专注于通用人工智能领域。DeepSeek 已研发开源十余款模型,其中 V3 对话模型和 R1 推理模型备受关注。V3 采用混合专家架构,在代码生成、数学推理等场景表现出色;R1 基于强化学习训练,专注于代码生成和复杂数学问题解决,且推理能力可迁移至小型模型。这两款模型的发布使得 DeepSeek 的关注度大幅提升,如 2024 年 12 月 28 日 DeepSeek 指数达到约 6000 万,2025 年 1 月 31 日更是飙升至 9.8 亿。
在技术层面,DeepSeek 运用了多种创新技术。混合专家 MoE 架构让模型在运行时每个词元仅激活部分专家,有效节约计算资源,提升处理复杂任务的能力;多头潜在注意力 MLA 通过对注意力键和值进行低秩联合压缩,降低推理时的内存占用;多词元预测训练 MTP 在不增加训练时间和内存消耗的情况下,实现同时预测多个未来词元;FP8 混合精度训练采用细粒度量化策略等方法,在保证训练效果的同时降低存储占用。此外,强化学习中的群体相对策略优化(GRPO)对传统近端策略优化算法(PPO)进行改良,提高了计算效率,降低内存占用。这些技术的应用,使得 DeepSeek 在性能表现上可与国际领先模型相媲美,且训练和推理成本更低。例如,DeepSeek - V3 在 2048 块 H800 GPU 训练 3.7 天,最后一轮训练硬件成本仅约 558 万美元,而 Meta 同规格的 Llama 3.1 模型约花费 9240 万美元,相比高出 16 倍;以官方 API 接入价格为例,对话模型 DeepSeek V3 价格约为 OpenAI GPT - 4o 价格的十分之一,推理模型 DeepSeek R1 价格约为 OpenAI o1 价格的二十分之一。
DeepSeek 在地方政府、央企、地方国企及智能终端等领域均有广泛部署。在地方政府方面,我国东部、中部、西部以及东北地区的 72 个省级或市级政府部门已全面部署,其中东部地区有 39 个,西部地区有 14 个,中部地区有 11 个,东北地区有 8 个。各地政府利用 DeepSeek 开展了多种应用,如北京市市场监管局通过百度智能云千帆大模型平台接入 DeepSeek,实现企业登记注册业务 24 小时在线 “智能咨询” 服务;丰台区政务服务和数据管理局基于 DeepSeek 开发 “丰小政” 数智助手,提供政策咨询解答等服务。在央企领域,全国 98 家央企中已有 60 家(集团或下属公司层面)完成部署,部署比例超过 60%,应用场景涵盖办公、能源、制造、通信等多个行业,例如中国核工业集团的多个公司借助 DeepSeek 助力核电应用升级,中国航天科技集团部署 DeepSeek 推出智能工作助手。在地方国企方面,我国四大直辖市国企中有 40 多家企业已全面部署,北京 18 家、上海 10 家、重庆 10 家、天津 9 家,应用涉及生产制造、金融创新、智能汽车等多个领域,像首钢集团利用 DeepSeek 实现 “智能审单” 系统的智能化,上海汽车集团将 DeepSeek 融入智舱提升交互功能。在智能终端领域,华为、小米、荣耀等品牌的相关机型,联想的 YOGA 系列笔记本和一体机,海信、美的等品牌的智能家电,以及比亚迪、东风等品牌的汽车均搭载了 DeepSeek 模型,实现了智能问答、文案生成、智能座舱升级等功能。
在使用方式上,DeepSeek 可独立使用,通过自然语言对话获取核心服务,官方总结了 17 种提示词使用方法,涵盖编程开发、文本分析、翻译等多个类别。同时,它也能与多种工具组合使用,实现 “DeepSeek +” 创新工作流,提升工作效率。例如,与 XMind 结合可快速制作思维导图,与飞书结合能分析智能数据与多维表格协作,与 Kimi 结合可生成智能 AI 演示文稿等。
从发展趋势来看,开源模型将推动 AI 应用生态加速繁荣,降低企业与创业者接入 AI 的成本和门槛,促进 AI 应用生态的多元化与可持续发展;AI 技术深入演进,推理模型有望成为主流形态,其链式思维输出方式可增强模型输出的可解释性;未来,每项业务、每位工作者、每个公司都将与 AI 技术深度融合,提升效率、增强决策能力和推动创新;“Agent + 协议” 可能成为企业应用的新范式,Agent 将自主规划任务、调用工具,减少人类参与。此外,DeepSeek 在 2025 年 2 月 24 日起启动开源周,连续 6 天总共开源 8 个代码库,包括 FlashMLA、DeepEP 等,这些开源成果将进一步推动技术的发展和应用。2025 年 4 月 3 日,DeepSeek 发布新论文,新模型 DeepSeek - GRM 准备开源,该模型在各种 RM 基准测试中表现优异,采用了通才奖励模型 GRM 和自我原则批评调整 SPCT 等创新方法。但需要注意的是,DeepSeek R1 模型存在幻觉率较高的问题,在使用时应加以甄别。