AI新闻

已选标签:
生成模型
12月 14日
6 条新闻
14:27

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

OpenAI开源新模型,采用Circuit Sparsity技术实现99.9%权重为零的稀疏性,使模型计算过程可拆解、易理解,解决了传统稠密Transformer的黑箱问题。该模型通过严格约束减少无效连接,保留关键路径,从而提高决策透明度。相比MoE,Circuit Sparsity在特征流形和功能边界上更优,但当前面临高算力成本挑战。未来研究将致力于优化训练机制,提升效率与实用性。

来源:量子位

11:41

为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026

为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026

RockAI创始人刘凡平提出,未来AI的发展应从云端大模型转向端侧设备的自主学习与原生记忆能力,强调硬件觉醒的重要性。他认为,当前主流的大规模Transformer架构和反向传播算法限制了真正的智能发展,而端侧模型通过实现个性化学习、持续进化,能够更好地模拟人类大脑的工作方式,促进群体智能的形成。这一转变不仅将重新定义硬件价值,还将推动人工智能迈向通用智能的新阶段。

来源:量子位

10:45

小扎忍痛,亲口宣告了元宇宙的死亡

小扎忍痛,亲口宣告了元宇宙的死亡

Meta计划削减元宇宙部门人力,将资源倾斜至销量火爆的AI智能眼镜。通过引入AI助手,使智能眼镜成为可语音交互的终端,市场反响热烈。此次战略调整标志着从VR转向AR及可穿戴设备的趋势,旨在提升用户体验和产品设计感。同时,Meta持续加大在数据中心和AI开发上的投入,以期在人工智能领域取得突破。

来源:36氪

09:42

甲骨文暴跌40%,AI 过度基建会拖垮巨头吗?

甲骨文暴跌40%,AI 过度基建会拖垮巨头吗?

尽管甲骨文、博通等公司手握巨额AI基建订单,但股价却出现大幅下跌,市场对AI基建的未来充满担忧。这些公司的客户主要集中在Meta、谷歌母公司Alphabet、微软等巨头及OpenAI等初创企业。虽然巨头们财务稳健,但AI业务尚未成为其收入的主要来源,而初创企业则依赖外部融资,存在较大不确定性。此外,数据中心建设和运营面临巨大挑战,如电力需求激增和冷却问题。整体来看,AI基建的可持续性受到质疑,行业正经历商业模式的根本转变。

来源:36氪

09:42

8 年后回到斯坦福,布林复盘谷歌 AI:错在太谨慎

谷歌联合创始人谢尔盖·布林在斯坦福演讲中反思了公司在Transformer技术上的失误,指出谷歌因过于谨慎而错失AI市场先机。自2022年底起,布林回归一线领导Gemini项目,旨在通过平台化策略重构工作流程,强调AI作为新的工作方式而非单一工具的重要性。同时,布林鼓励年轻人继续学习编程,认为AI虽能降低学习门槛但不减少应用需求,并建议创业者优先考虑产品的实用性。

来源:36氪

12月 13日
5 条新闻
22:43

半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了

半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了

陶哲轩团队借助AI工具在48小时内解决了尘封50年的Erdős#1026数学难题,展示了AI在辅助解决复杂问题上的巨大潜力。通过结合多种AI技术如AlphaEvolve和ChatGPT Pro等,研究者们能够快速探索解题路径并验证猜想,显著提高了科研效率。这标志着人与AI协作成为解决长期未决问题的新趋势,并鼓励更多领域尝试利用AI促进创新。

来源:量子位

22:41

美国视频生成老炮儿,入局世界模型

美国视频生成老炮儿,入局世界模型

Runway发布首个通用世界模型GWM-1及其变体,包括模拟真实环境的GWM Worlds、模拟对话的GWM Avatars和用于机器人操作的GWM Robotics。这些基于Gen-4.5升级版构建的模型采用自回归架构,支持实时交互控制,展示了在虚拟环境构建、客户服务及机器人训练等领域的应用潜力。同时,Gen-4.5新增原生音频生成与编辑功能,进一步扩展了其应用场景。

来源:量子位

22:27

豆包手机助手:使用系统原生截屏接口,无法截屏银行键盘等受保护内容

豆包手机助手发布技术说明:近期有网友发布视频称,“豆包手机助手通过READ_FRAME_BUFFER权限,从GPU渲染的图形缓冲区拿走图像数据,不需要走上层的截图API。还用了CAPTURE_SECURE_VIDEO_OUTPUT权限,可以获取银行安全键盘等受保护的界面内容”。这是对豆包手机助手技术实现方式的错误解读。豆包手机助手采用的是原生截屏接口(WindowManagerService.captureDisplay),严格遵循应用声明的Secure标记,无法截屏银行安全键盘等声明受保护的界面内容。需要强调的是,豆包手机助手仅在有用户指令时才会开始截屏,且无法截屏三方应用Secure标记页面。上传至云端大模型的截屏仅用于视觉理解和推理,完成任务后不会存储在云端。(广角观察)

来源:钛媒体

12:01

上海浦东:未来3年 新增1000家人工智能企业

在GDPS 2025全球开发者先锋大会开幕式上,上海市浦东新区支持人工智能创新创业政策发布。从现场获悉,目前浦东形成了涵盖底层芯片、算法模型和垂类应用的完整生态, AI产业规模已经突破1600亿,未来三年目标新增人工智能企业1000家,核心产业规模超过2500亿元。(科创板日报)

来源:钛媒体

12:01

投资AI的VC会变成AI吗?

投资AI的VC会变成AI吗?

文章通过小红书博主的视角,讨论了AI时代下投资人决策模式化现象。类比于编程语言中的’If、else、return’逻辑,作者指出当前投资界对于AI相关术语如VLA、LLM等形成了类似标准化话术,反映了信息过载背景下快速筛选项目的需要。然而这种’代码化’也导致了创新项目被忽视的风险,强调了在AI快速发展背景下,保持开放性和灵活性的重要性。

来源:36氪

12月 12日
9 条新闻
20:40

三大国产AI学习助手实测:谁能真正带学生提高一分?

三大国产AI学习助手实测:谁能真正带学生提高一分?

近期,国产AI助手如灵光、豆包手机助手及千问App在教育领域的应用迅速发展,展示了从技术竞争向实际应用场景过渡的趋势。通过五项实测(讲题、错题诊断、出练习题、制定学习计划和连续对话与陪伴),评估了三款AI助手在辅助学生学习中的表现。结果显示,它们在不同方面各有优势:豆包擅长结构化教学,千问更注重逻辑性和亲和力,而灵光则倾向于提供细致的教学设计。整体而言,这些AI助手已经具备了较强的学习辅助能力,并在不断优化中提升用户体验。

来源:36氪

19:38

你的专业工作,70.9%可能已被AI超越:GPT-5.2深度评测

你的专业工作,70.9%可能已被AI超越:GPT-5.2深度评测

OpenAI推出GPT-5.2,首次在专业任务上整体表现超越人类专家。新模型精准聚焦专业知识型工作,通过三版本策略满足不同需求。GPT-5.2在深度办公、代码驾驭、长上下文理解及视觉理解等方面实现显著突破,成为高效且可靠的智能协作者。随着其逐步开放给全球用户,标志着AI从信息提供者转变为价值创造者的转折点。

来源:36氪

19:38

花10亿美元,迪士尼让AI来拍“短片”了

迪士尼与OpenAI达成深度合作,授权超过200个IP元素用于Sora和ChatGPT Images中,标志着娱乐行业进入AI工业化阶段。通过生成式AI技术,粉丝可以轻松创作包含迪士尼角色的短视频和静态图像,并有机会在Disney+上展示。此次合作不仅改变了IP运营逻辑,还可能影响未来剧集生命周期评估标准。

来源:36氪

18:36

实测 GPT-5.2 :价格暴涨能力微涨,凭什么反击 Gemini

实测 GPT-5.2 :价格暴涨能力微涨,凭什么反击 Gemini

GPT-5.2发布,包含Instant、Thinking和Pro三个版本,其在多模态理解和推理能力上显著提升,特别是在专业任务处理与3D建模方面表现优异。尽管响应时间变长,但准确性和复杂任务处理能力增强。知识更新至2025年8月。编程测试中,GPT-5.2展示了强大的代码生成能力,但在某些特定场景下仍落后于Claude。价格方面,GPT-5.2较前代上涨约40%。

来源:36氪

18:36

阻止互联网广告下滑,全靠AI?

阻止互联网广告下滑,全靠AI?

百度和快手在2025年Q3财报中首次披露了AI广告或营销带来的具体收入增长,如百度AI原生营销服务同比增长262%至28亿元。AI技术正通过提升广告效率、优化用户体验等方式重塑营销行业,成为互联网公司新的增长引擎。尽管AI广告展现出巨大潜力,但其在创意真实性和消费者信任度方面仍面临挑战。

来源:36氪

17:33

OpenAI用GPT-5.2“反击”谷歌,刀子够快吗?

OpenAI用GPT-5.2“反击”谷歌,刀子够快吗?

OpenAI发布GPT-5.2,强调其在专业任务如编码、法律、金融等领域的卓越表现。尽管在多项基准测试中领先,但与竞争对手如谷歌Gemini 3 Pro的差距并不明显。AI竞赛已进入多方混战阶段。面对商业化压力和技术挑战,OpenAI正积极寻求在垂直领域建立优势,并探索广告和交易分成等新商业模式。

来源:36氪

16:32

里程碑时刻,首个100B扩散语言模型来了,技术报告揭秘背后细节

里程碑时刻,首个100B扩散语言模型来了,技术报告揭秘背后细节

扩散语言模型(dLLM)在短时间内实现了从16B到100B参数规模的飞跃,展现出超越传统自回归模型的潜力。蚂蚁集团联合多所高校推出的LLaDA2.0系列模型采用MoE架构,在多个复杂任务上表现优异。通过持续预训练策略和系统化后训练流程,成功将AR模型平滑转化为dLLM,并解决了长文本生成效率低下的问题。

来源:36氪

15:30

GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

GPT-5.2发布即降智?背后华人被挖出,清北校友核心贡献

GPT-5.2发布,据官方基准测试,在完成经济价值任务如电子表格制作、PPT设计、代码编写与审查等方面表现出色,甚至在某些基准测试中超越专业人士。尽管有用户反映初期存在功能不稳定现象,但多位专家和用户实测反馈其在复杂推理、数学计算及编程方面实现显著进步,尤其是构建3D图形引擎等高难度任务上的表现令人印象深刻。

来源:36氪

Back to top button