来自路透社等媒体报道的最新消息:DeepSeek 未发布的 V4 Lite 模型遭泄露上网,华为获得早期访问权限,英伟达被排除在外。近期,谷歌发表了2篇Multi-Agent协作学习新论文
有网友提供了更加详细的信息,DeepSeek V4 Lite :
100万 token 上下文窗口(V3 为 128K) 内置原生多模态推理能力 内部代号为 "sealion-lite","Lite" 可能意味着成本优化,而非能力降低 比网页版 / App 版模型好得多
以及 DeepSeek V4 Lite生成的一些 SVG 效果:
仅用 54 行代码就能呈现一个细节丰富的 Xbox 手柄,或用 42 行代码描绘一只骑自行车的鹈鹕
这些输出不仅紧凑,还展现出先进的空间推理能力——这是一项对需要精确几何理解的任务至关重要的技能。
PaperAgent整理了DeepSeek过往模型发布时间,期待V4的真实发布~
A5创业网 版权所有