deepseek的训练成本到底有没有假？-美国VPS综合讨论-全球主机交流论坛 - 手机版

1^# rebeke
收藏 2025-1-29 11:14:51

他光说自己便宜，有任何客观证据吗？

推荐 梦想成真
2025-1-29 11:23:34

本帖最后由梦想成真于 2025-1-29 11:26 编辑

论坛这帮孙子前几天都说是套壳吗，你认为论坛那些垃圾废物能回答出啥

推荐 wwbfred
2025-1-29 16:56:22

任何你不熟悉的东西，你都可以等几个月再过来看。
时间会让一切事物露出它的原型。只要你不着急下结论，谁都无法骗到你。

推荐 掩耳盗铃
2025-1-29 11:24:31

不需要你自己验证，市场资本已经表现出来了

推荐 迪士尼
2025-1-29 11:44:00

咱们论坛有很多杠精，你提出一个观念，他们非要和你杠，这种人往往现实生活中没啥本事，看人家脸色行事，只能在网上跟你人家杠

2^# DogeLee2
2025-1-29 11:22:24

本帖最后由 DogeLee2 于 2025-1-29 11:40 编辑

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

有论文的，自己看

我觉得肯定不止550万美金
但是实际上就算翻十倍
那成本也很低了

3^# julie
2025-1-29 11:22:34

所有成本加起来几乎肯定不止几百万美金的. 就象房屋装潢成本不能就计算建材费用一样!

6^# 我是老王
2025-1-29 11:25:39

那么多美国大学都说是真的怎么到你这里还要验证？

8^# rebeke
2025-1-29 11:51:28

引用: 掩耳盗铃发表于 2025-1-29 11:24
不需要你自己验证，市场资本已经表现出来了

美股又反弹大涨了，就是因为出现了质疑deepseek造假的情绪，到底是不是大量使用了禁售的H100训练模型？

9^# 四叶草
2025-1-29 13:20:15

假的
但凡有一个中文字的东西都是假的

台积电内鬼卖的

10^# sliver
2025-1-29 13:50:53

本帖最后由 sliver 于 2025-1-29 14:14 编辑

推上的说法是计算方法不同

当我们说大模型成本的时候，包含比如 H100 的硬件、获取数据、人员工资等在内，deepseek 的单次训练成本并没有包含这些。今天的一个说法是 deepseek 利用了新加坡的机房绕开美国管制，它并没有获得足够的奶牛（芯片），但获得了足够的牛奶（算力），这也使得它在谈论 “成本” 时更简单和低廉

即使这样， deepseek 依然令人惊艳

推上还有一个比喻，openai 等头部是花费大量心力培养了了一个高级教授，deepseek 是向教授学习的学徒，只需要 4年学期，并且他在向多位不同的教授学习。后者在某些分支的深度上可能不如前者，但成本低廉，并且在整体广度和深度上，甚至可能表现比前者好

deepseek的训练成本到底有没有假？ 只看楼主

deepseek的训练成本到底有没有假？只看楼主