最新新闻
- 家居要闻丨新智家周刊(310-314)
- 【要闻】宋诚蒋冰会见禾丰食品股份有限公司客人|Welcome彩票中心
- 【要闻】江苏黄埔再生资源利用有限公司来我市进行考察座谈
- 一周全球公司十大要闻 中国主要车企2024年销量普遍增长;中国商飞寻求尽早获得欧洲认证
- 313中财网晚七点:明日要闻、利好利空消息-更新中
- 一周全球公司十大要闻 特朗普废除美国纯电动汽车促进政策;碧桂园停牌九个月后恢复交易|722cc大发彩票官方版下载
- 销售公司2024年十大要闻
- 一周全球公司十大要闻 蚂蚁集团表示没有上市计划;大众汽车与工会谈判达成协议
- 崩铁:32那刻夏v0技能曝光!pv预告新角色流萤喜得新皮肤!
- 福州国贸天琴樾售楼处【首页】售楼处位置-售楼中心楼盘详情
2025-01-31
最壕的DeepSeek玩家:10多万元买8台Mac、显存达496GB
分享到:
不过再带上成本成本约1/30这个条件看,又是不一样的感觉,给老哥整无语了★★★。
总计496G显存(64*7+48),才能跑起个4bit量化版,但属实算得上“家用AGI”配置了。
但同样,带上几毛钱就能解决一道题★,o1系列至少要10块钱这个背景来看,又是不一样的感觉★★★。
DeepSeek-R1,正在接受全球网友线秒用manim代码制作解释勾股定理的动画★★★,一次完成无错误。
在开发者Xeophon自己的个人测试上,甚至超过了o1-preview★★★。
公开数据上更是解决了20.5%的问题,与DeepSeek-V3相比上涨约46%。
o1系列一战成名的ARC-AGI★★,测试结果分为公开数据和私有数据两部分。
另一个极端是选择R1数据蒸馏版Qwen 1★.5B小模型,小到浏览器就能跑,每秒能输出60个tokens。
谁来构建一个平台★,能轻松地在DeepSeek R1上进行OpenAI风格的强化微调。
同一个测试上,R1数据蒸馏的Qwen 32B,与DeepSeek-V3,GPT-4o和Gemini Flash处于同一水平。
首先是LiveBench★★,与LiveCodeBench一样,题目是随时间更新的,所以相对受认可。