



春节期间,来自杭州的 DeepSeek 在 AI 领域迅速走红。它基于 Transformer 架构的 “注意力机制”,通过 “阅读” 海量知识学会语言规律,能像即兴演讲大师般生成内容,但也存在 “AI 幻觉” 问题。
DeepSeek 脱颖而出得益于硬实力、性价比和开源共享三方面。在硬实力上,其推理能力强大,DeepSeek R1 是开源大模型中的佼佼者,在多个基准测试中表现出色。在英文测试中,MMLU(Pass@1)达到 90.8,DROP(3-shot F1)为 92.2;在代码测试里,LiveCodeBench(Pass@1-CO)达 65.9 ,Codeforces(Percentile)为 96.3;数学测试中,AIME 2024(Pass@1)有 79.8,MATH - 500(Pass@1)高达 97.3;中文测试时,CNMO 2024(Pass@1)为 78.8 ,C-Eval(EM)达 91.8,这些成绩使其直追 OpenAI 的王牌选手。
性价比方面,DeepSeek 也十分突出。通过优化训练方式,V3 模型训练成本压缩至 557.6 万美元。其使用价格低廉,deepseek - chat 模型百万 tokens 输入缓存命中只需 0.5 元,缓存未命中 / 英文时为 2 元,输出为 8 元;deepseek - reasoner 模型百万 tokens 输入缓存命中 1 元,缓存未命中 / 英文 4 元,输出 16 元 ,被称为 “大模型界的拼多多”。
在开源共享上,DeepSeek 完全开放代码并允许免费商用,与其他设置壁垒的大模型形成鲜明对比,引发全球共鸣。
想要用好 DeepSeek,沟通至关重要。可采用 “四步提问法”,即背景 + 任务 + 要求 + 补充,像给新开咖啡馆制定开业促销方案,明确各要素后,DeepSeek 能给出更贴合需求的方案,如在预算 1 万元内,面向大学生群体,位于大学城且主打精品咖啡的情况下,给出包含预热期、开业期和后续留存阶段的详细方案,且预算分配合理,活动设计针对性强。
处理复杂任务时,需拆解任务。以写 “远程办公的未来发展” 文章为例,先让其写大纲,再逐步完善各部分内容,最后检查优化。使用过程中还可连续提问,如对咖啡馆开业方案,可针对其不足提出优化方向,逐步完善。
此外,不同 AI 各有特长,DeepSeek 擅长方案规划和思路整理,但文学创作时,文字易堆砌修饰语。Claude 文字简洁优雅,更适合文学性任务。了解各 AI 特点,根据任务选择合适的,能提升效率。