全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 342|回复: 3
打印 上一主题 下一主题

在1.25欧的机器上部署蒸馏的deepseek到底多弱智

[复制链接]
跳转到指定楼层
1#
发表于 2025-2-12 14:40:24 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
含部署指北 原文:https://zhujisou.com/1278.html

1.5b参数是头两张没有标注的图
7b、8b的也没好到哪去 哈哈哈
个人认为,7b、8b的模型 在加上向量数据库后,可以对接微信或者QQ机器人,回答一些简答的客户问题,或者伪装在线客服,反正纯CPU推理速度也就在1token/s左右,挺像是人工客服打字慢慢回来着。

如果正儿八经的需要生产力的臂助,可以考虑在scnet、autodl部署32b、70b的版本,或者使用目前成本相对较低、api可用性强于deepseek官方的硅基流动(这家也提供了很多公益的小模型api免费用)




2#
发表于 2025-2-12 14:41:12 | 只看该作者
这不是蒸馏deepseek,这是蒸馏大便。
3#
 楼主| 发表于 2025-2-12 14:43:08 | 只看该作者
大爷 发表于 2025-2-12 14:41
这不是蒸馏deepseek,这是蒸馏大便。

说真的 本身对1.5b的小参数模型没有抱期望,但是它思考出 兔子2条腿 2个头是真爆笑了
4#
发表于 2025-2-12 14:45:24 | 只看该作者
deepseek的模型32B起步才能算正常点,更低的模型连字数统计都完成不了,每次让他写1000字文章只给输出四五百字。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-3-1 15:11 , Processed in 0.064465 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表