AI新闻

已选标签:

多模态AI

12月 12日

3 条新闻

16:32

中国制造的「领航样本」，为何藏在海康威视智能工厂里？

海康威视智能工厂通过自研的AI技术，包括工业视觉设备、柔性机械臂、移动机器人及调度系统、多模态感知与大模型等，实现了多品种小批量大规模定制化生产。其智能化进程从数字化协同到数据驱动决策，再到基于大模型和多模态感知的系统智能阶段，展示了中国制造在复杂场景下的创新能力与发展潜力。

来源：36氪

15:30

港中文联手美团开源“视觉推理通才”，图像视频10类任务一网打尽

香港中文大学MMLab与美团研究团队开源OneThinker，一个基于RL的多模态视觉推理通才模型，覆盖图像与视频十类核心任务，在31项主流视觉任务测试中表现优异。通过构建统一数据体系和优化多任务训练方法（如EMA-GRPO算法），OneThinker解决了传统RL模型在单一模态或任务上的局限性，展现了跨模态、多任务的通用理解和零样本能力，为实现通用视觉智能提供了新路径。

来源：36氪

15:30

跳过“逐字生成”，蚂蚁集团赵俊博：扩散模型让我们能直接修改Token

赵俊博在量子位MEET2026智能未来大会上介绍了扩散架构语言模型LLaDA 2.0，该模型采用完形填空式预测机制，相比自回归模型，在相同计算量下参数规模更小、生成速度更快且成本更低。团队已开源LLaDA 2.0，并验证其可扩展至千亿规模。尽管扩散语言模型的训练与推理仍处于早期阶段，但其独特优势吸引了谷歌、字节等巨头及初创公司的积极布局。

来源：36氪

12月 6日

6 条新闻

12:48

豆包手机助手调整权限：AI手机是洪水，但不是猛兽

豆包手机助手引发的AI操作争议揭示了移动互联网生态与AI-Agent技术间的矛盾。该助手通过GUI-Agent技术执行任务，但因涉及敏感授权和公平性问题，被部分应用限制使用。文章探讨了AI时代下，如何平衡用户便利、数据安全及行业规范，并预测未来AI手机将与互联网服务建立新型协作关系，实现更高效的操作体验。

来源：36氪

11:47

据报道，作为对谷歌与Anthropic加速竞争的首次“应急式”回应，OpenAI正准备推出其最新的GPT-5.2，当前内部计划的发布日期为12月9日，较原定的12月下旬计划明显提前。知情人士称，GPT-5.2应该能弥补谷歌上个月发布Gemini 3所拉开的差距。目前，Gemini 3在多项评测中名列前茅，并引起了Altman与马斯克的关注。本周早些时候，OpenAI首席执行官Sam Altman宣布公司进入“红色警报 (code red)”状态，以快速应对来自谷歌Gemini 3和Anthropic等竞争对手带来的日益增长的压力。随后，Altman在内部评估中表示，即将推出的GPT-5.2在推理能力上将“领先于谷歌的Gemini 3”。（广角观察）

来源：钛媒体

09:41

好莱坞的鱼头终于朝向了奈飞

奈飞以827亿美元收购华纳兄弟，标志着流媒体巨头在内容产业中的话语权进一步集中。此次并购不仅涉及电影电视工作室和HBO Max等资产，还反映了AI技术在内容推荐、个性化定制及广告投放等方面的应用前景。未来，随着AI技术的不断进步，尤其是在多模态处理与自然语言理解方面的能力提升，预计将推动流媒体平台在用户互动体验上的创新，并对传统院线模式构成挑战。同时，也引发了关于数据安全、算法偏见以及行业垄断等问题的关注。

来源：36氪

08:39

开源和闭源模型的差距在拉大：这是DeepSeek论文揭示的残酷真相

DeepSeek 发布 V3.2 技术报告，指出开源大模型与闭源模型的性能差距在扩大。报告通过对比测试显示，开源模型在复杂任务上明显落后于闭源模型。论文分析了三个关键问题：传统注意力机制效率低、后训练资源投入不足、AI Agent 能力滞后，并提出相应解决方案，包括引入 DSA 机制、增加后训练预算和开发系统化任务合成流程，显著缩小了与闭源模型的差距。

来源：36氪

07:43

前谷歌员工创立的Yoodli估值翻三倍至逾3亿美元，其AI旨在辅助而非取代人类

Yoodli，一家利用AI进行沟通培训的初创公司，估值超3亿美元。该公司通过模拟销售通话、领导力辅导等场景，帮助用户提升演讲技巧。Yoodli采用多语言模型支持多种语言，并可嵌入企业现有软件中。其平台不仅限于公众演讲练习，还扩展到面试准备、销售演示等领域，强调AI辅助而非替代人类教练。

来源：TechCrunch AI

05:02

Meta收购AI设备初创公司Limitless

Meta收购AI初创公司Limitless，后者曾推出AI驱动的可穿戴设备以记录对话。尽管Limitless将停止销售硬件并逐步减少服务，但其团队将助力Meta开发AI赋能的可穿戴设备，特别是AR/AI眼镜领域，加速实现个人超级智能愿景。此举反映了AI硬件市场竞争加剧及大型科技公司在该领域的布局趋势。

来源：TechCrunch AI

12月 4日

7 条新闻