2025-01-31
最壕的DeepSeek玩家:10多万元买8台Mac、显存达496GB
分享到:

  不过再带上成本成本约1/30这个条件看,又是不一样的感觉,给老哥整无语了★★★。

  总计496G显存(64*7+48),才能跑起个4bit量化版,但属实算得上“家用AGI”配置了。

  但同样,带上几毛钱就能解决一道题★,o1系列至少要10块钱这个背景来看,又是不一样的感觉★★★。

  DeepSeek-R1,正在接受全球网友线秒用manim代码制作解释勾股定理的动画★★★,一次完成无错误。

  在开发者Xeophon自己的个人测试上,甚至超过了o1-preview★★★。

  公开数据上更是解决了20.5%的问题,与DeepSeek-V3相比上涨约46%。

  o1系列一战成名的ARC-AGI★★,测试结果分为公开数据和私有数据两部分。

  另一个极端是选择R1数据蒸馏版Qwen 1★.5B小模型,小到浏览器就能跑,每秒能输出60个tokens。

  谁来构建一个平台★,能轻松地在DeepSeek R1上进行OpenAI风格的强化微调。

  同一个测试上,R1数据蒸馏的Qwen 32B,与DeepSeek-V3,GPT-4o和Gemini Flash处于同一水平。

  首先是LiveBench★★,与LiveCodeBench一样,题目是随时间更新的,所以相对受认可。