全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 517|回复: 10

[特价VPS] deepseek也没说的那么厉害

[复制链接]
发表于 4 天前 来自手机 | 显示全部楼层 |阅读模式
24点游戏:12 12 11 3
就这个一眼就知道答案的24点,deepseek思考了五分钟,打了一大版的草稿,最后得出结论:无解。
看网上有人测试拿来做2023年高考数学题考了142分,目前看有点水分,各位大佬觉得如何
发表于 4 天前 来自手机 | 显示全部楼层
问一些rust 代码问题deep都答不上来的。感觉deep的推理很弱。只要是网上没有的答案!永远答不出来!
发表于 4 天前 | 显示全部楼层
我也用了几天,还是不如gpt
发表于 4 天前 | 显示全部楼层
人家那么多权威评比不看,自己拿几个案例有啥用
日常用没啥问题,反正我用免费的openai和deepseek没感觉太大区别
付费的没用过
发表于 4 天前 | 显示全部楼层
乐了,自己看看你家GPT o1,(12−3)×(12/11)=24
发表于 4 天前 | 显示全部楼层
散了吧,这蠢货鉴定为纯黑子,实测R1思考一次107秒就能解出来
发表于 4 天前 | 显示全部楼层
这种例子意义不在在。
之前 试4o 和 V3.
4o 连 9.9 和 9.11 谁大都能算错。

所有的AI都不是完美的,他们的答案,都是有一定随机性。
关键在于你在平时使用着,谁帮助你最大。这才是最重要的。
如果你觉得GPT.能帮你,你就用GPT就行了。
AI就是个工具。
DS最大的功破案率是把GPT 价格打下来,这还不够么?
如果真的那么烂。GPT 没必要有啥反应。有反应也说明,打到痛点了。
发表于 4 天前 来自手机 | 显示全部楼层
pykane 发表于 2025-2-3 10:59
这种例子意义不在在。
之前 试4o 和 V3.
4o 连 9.9 和 9.11 谁大都能算错。

gpt有反应,但不大,倒是某些人感觉像亲妈爆炸了
发表于 3 天前 | 显示全部楼层
本帖最后由 327253236 于 2025-2-4 14:18 编辑

这群台蛙跳梁小丑,不予理会才是正解。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-2-7 23:46 , Processed in 0.071457 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表