V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
hedwi
V2EX  ›  分享发现

deepseek 超越 Claude 3.5 紧追 o1

  •  
  •   hedwi · 18 小时 6 分钟前 · 749 次点击

    DeepSeek-V3 的综合能力 DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。

    在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。

    https://www.deepseek.com

    11 条回复    2024-12-27 21:09:05 +08:00
    yinmin
        1
    yinmin  
       18 小时 5 分钟前 via iPhone
    实际多用一段时间 v3 ,还是觉得有差距
    hedwi
        2
    hedwi  
    OP
       18 小时 4 分钟前
    @yinmin 不是才出的么 你用了多久了 我只觉得比以前快了好多
    tool2dx
        3
    tool2dx  
       18 小时 0 分钟前
    刚充钱了,回复是挺快的,测试了一下代码,回答属于一线水准,日常能用就行。
    hedwi
        4
    hedwi  
    OP
       17 小时 42 分钟前
    @tool2dx 我之前充的还没花完 很便宜
    LaTero
        5
    LaTero  
       17 小时 2 分钟前 via Android
    好慢啊,是刚上线太多人试超载了吗。而且我有点好奇,这公司是怎么做的 600B 的模型 1 元 100 万个 token 不亏本的?还是现在还处在亏本挣吆喝的阶段?
    Hookery
        6
    Hookery  
       16 小时 55 分钟前
    @LaTero 大模型都是虧本的,靠 token 也只是一點毛毛雨回血。
    cnkuner
        7
    cnkuner  
       16 小时 54 分钟前
    今天试用了,让分析一个 Excel 表格,输出很满意。
    不过听说军儿在挖 deepseek 的团队。
    hedwi
        8
    hedwi  
    OP
       16 小时 20 分钟前
    @Hookery 他家据说能盈利的 不知道真假
    hedwi
        9
    hedwi  
    OP
       16 小时 20 分钟前
    @LaTero 他这个训练成本低很多 只有几分之一 有点东西
    hedwi
        10
    hedwi  
    OP
       16 小时 19 分钟前
    @cnkuner 已经挖走了一个天才少女好像
    Donaldo
        11
    Donaldo  
       12 小时 49 分钟前
    上下文有些短,丢了比较长的论文进去,不够用
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2684 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 01:58 · PVG 09:58 · LAX 17:58 · JFK 20:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.