deepseek也没说的那么厉害

扛麦郎 · 发表于 2025-2-3 10:37:14

24点游戏：12 12 11 3
就这个一眼就知道答案的24点，deepseek思考了五分钟，打了一大版的草稿，最后得出结论：无解。
看网上有人测试拿来做2023年高考数学题考了142分，目前看有点水分，各位大佬觉得如何

奧巴马 · 发表于 2025-2-3 10:57:14

问一些rust 代码问题deep都答不上来的。感觉deep的推理很弱。只要是网上没有的答案！永远答不出来！

iiii.im · 发表于 2025-2-3 10:41:37

我也用了几天，还是不如gpt

yabs · 发表于 2025-2-3 10:42:22

人家那么多权威评比不看，自己拿几个案例有啥用
日常用没啥问题，反正我用免费的openai和deepseek没感觉太大区别
付费的没用过

Google执行董事 · 发表于 2025-2-3 10:48:31

乐了，自己看看你家GPT o1，(12−3)×(12/11)=24

Google执行董事 · 发表于 2025-2-3 10:53:39

散了吧，这蠢货鉴定为纯黑子，实测R1思考一次107秒就能解出来

pykane · 发表于 2025-2-3 10:59:38

这种例子意义不在在。
之前试4o 和 V3.
4o 连 9.9 和 9.11 谁大都能算错。

所有的AI都不是完美的，他们的答案，都是有一定随机性。
关键在于你在平时使用着，谁帮助你最大。这才是最重要的。
如果你觉得GPT.能帮你，你就用GPT就行了。
AI就是个工具。
DS最大的功破案率是把GPT 价格打下来，这还不够么？
如果真的那么烂。GPT 没必要有啥反应。有反应也说明，打到痛点了。

蒙面人 · 发表于 2025-2-3 11:07:57

pykane 发表于 2025-2-3 10:59
这种例子意义不在在。
之前试4o 和 V3.
4o 连 9.9 和 9.11 谁大都能算错。

gpt有反应，但不大，倒是某些人感觉像亲妈爆炸了

rqp · 发表于 2025-2-4 14:04:55

327253236 · 发表于 2025-2-4 14:12:16

本帖最后由 327253236 于 2025-2-4 14:18 编辑

这群台蛙跳梁小丑，不予理会才是正解。

		自动登录	找回密码
密码			注册

[特价VPS] deepseek也没说的那么厉害