DeepSeek发布多模态论文又连夜删除,主要透露了啥?

admin3小时前天气预报4

  在节假日前一天发布重磅论文,“这很DeepSeek”。

  DeepSeek终于能“看见”了。前两天,DeepSeek偷偷开启了多模态能力的灰度测试,部分用户打开DeepSeek首页会发现,界面多了一个“识图模式”的入口。上传图片后,DeepSeek能像人一样理解画面了。

DeepSeek发布多模态论文又连夜删除,主要透露了啥?

  DeepSeek多模态团队负责人陈小康在4月29日发文称,“现在,我们能看见你了。”这是DeepSeek的聊天产品第一次接入多模态。

  就在4月30日,DeepSeek又发布了一篇关于多模态技术报告《Thinking with Visaul Primitives》(《用视觉原语思考》),阐释了这次上新的多模态技术背后的细节。

  在五一节假日前一天发布重磅论文,“这很DeepSeek”。但很快大家发现,官方连夜删除了多模态仓库和论文原文,5月1日打开Github界面已经是“404”状态。

DeepSeek发布多模态论文又连夜删除,主要透露了啥?

  关于删除原因官方并没有特别说明,不过有猜测不是内容问题,而是信息透露太多。

  这次的论文说了些啥?从行业反馈来看,论文符合DeepSeek扎实且务实的风格,同样在通过工程能力降低成本,采用了新的范式,也意味着,DeepSeek开始在视觉模型上发力了。

  具体来看,DeepSeek的论文指出,目前的多模态模型在复杂任务上崩溃,不是因为看不见(感知鸿沟),而在于“指不准”(引用鸿沟)。

  自然语言天然具有模糊性。当用户要求模型处理复杂的空间布局时,仅靠文字描述很容易产生歧义。就像数一堆散落的硬币,如果不用手指逐个按着确认,人类也很容易数错或数重。

  DeepSeek的解法是给模型配上一只“手指”。通过引入“视觉原语”(Visual Primitives)框架,模型将点、边界框等空间标记提升为最小思维单元。这意味着模型在推理时,能够一边“想”一边“指”,将抽象的语言逻辑指向到具体空间坐标。

  这一灵感借鉴了人类的认知。论文提及,人类走迷宫或数密集物体时,会用手指这类指示性指向来降低认知负荷、维持逻辑一致性。通过将视觉原语嵌入思考,模型可以模拟人类这种“指向-推理”的协同。

  这一模型基于DeepSeek-V4-Flash(总参数2840亿)构建。DeepSeek的大量实验表明,该方法在推理精度上实现显著突破,在空间推理、视觉问答等挑战性任务上,性能持平或超越 GPT、Claude、Gemini 最新版本。

  DeepSeek的研究证明:多模态智能的未来,不只是 “看见更多像素”,而是构建语言与视觉之间精准、无歧义的指代桥梁。

  值得一提的是,DeepSeek在4月24日发布了V4系列旗舰模型,这次发布并没有涉及传言已久的多模态。官方当时对V4的定义是:支持百万字超长上下文,在 Agent(智能体)能力、世界知识和推理性能上均实现国内与开源领域的领先。

  多模态已经成为当前大模型更新的一个重要方向,而DeepSeek在这一方面却迟迟未跟上,这也被认为是DeepSeek能力上的一大短板。也有传言称,DeepSeek暂缓多模态生成的训练策略,主要源于算力和现金的掣肘,在融资后,或许这一方向的训练会更加顺利。

相关文章

全球各国能源需求面临燃料配给风险

  在能源供应受损的背景下,全球各国政府考虑实施需求管控,这加大了需求破坏风险——若持续下去,可能对埃克森美孚和雪佛龙等石油巨头构成压力。...

法航荷航集团提交对葡萄牙航空的股份竞购提议

  欧洲最大的航空公司集团之一拉开对葡萄牙航空的竞购战序幕,法航荷航集团率先提交了首个已知的股份竞购提议。   这份不具约束力的竞购提议已于周四提交,赶在政府设定的截止期限之前。葡萄牙正推进出售葡萄牙...

国务院发展研究中心王青:现阶段汽车销量潜在增长率大概在3%-4%

国务院发展研究中心王青:现阶段汽车销量潜在增长率大概在3%-4%

专题:智能电动汽车发展高层论坛(2026)   4月11日-12日,智能电动汽车发展高层论坛(2026)在北京国家会议中心二期召开,主题为“推进新能源汽车智能化、绿色化、融合化、国际化发展”。   国...

港股午评:恒指涨1.98% 科指涨1.59% 科网股、黄金股普涨 创新药概念强势

港股午评:恒指涨1.98% 科指涨1.59% 科网股、黄金股普涨 创新药概念强势

  4月1日消息,港股三大指数集体上涨。截至午间收盘,恒生指数涨1.98%,报25277.74点,恒生科技指数涨1.59%,国企指数涨1.55%。盘面上,科网股涨多跌少,哔哩哔哩涨超5%,网易、百度...

电解液龙头天赐材料子公司起诉昔日总工程师,称“液体六氟磷酸锂”等技术被窃!要求多方赔偿14.72亿元

电解液龙头天赐材料子公司起诉昔日总工程师,称“液体六氟磷酸锂”等技术被窃!要求多方赔偿14.72亿元

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   电解液龙头天赐材料子公司起诉昔日总工程师,称“液体六氟磷酸锂”等技术被窃!要求多方赔偿14.72亿元,透露有公司已把相...

建行副行长雷鸣:在全行网点问题响应的过程当中,AI助手的覆盖率已达到99.42%

  3月27日金融一线消息,中国建设银行今日召开2025年年度业绩发布会。谈及建行在AI领域的实践,副行长雷鸣表示,我们夯实了人工智能的基础能力,在算力方面坚持适度超前,为业务发展留够足够的空间。在过...