一份写给普通人的DeepSeek速成指南

一份写给普通人的DeepSeek速成指南

lili
2025-03-31 15:06:29
《一份写给普通人的 DeepSeek 速成指南》介绍了春节期间崛起的 AI 新星 DeepSeek。它基于 Transformer 架构的 “注意力机制”,通过学习海量知识掌握语言规律,但存在 “AI 幻觉” 现象。DeepSeek 凭借硬实力、性价比和开源共享获得关注。在硬实力方面,其 R1 版本在多个基准测试中成绩优异,如英文 MMLU(Pass@1)达 90.8 ,代码 Codeforces(Percentile)为 96.3 ,数学 AIME 2024(Pass@1)为 79.8 ,中文 CNMO 2024(Pass@1)达 78.8 ,直追 OpenAI 王牌选手。性价比上,V3 模型训练成本为 557.6 万美元,使用价格低,如 deepseek - reasoner 模型百万 tokens 输入缓存命中 1 元、输出 16 元。它还完全开源并允许免费商用。
报告来源:
.
下载报告
免费下载
免费下载
小程序
小程序
小程序
交流群
交流群
交流群
回到顶部