AI新闻

已选标签:
AI训练
12月 14日
2 条新闻
14:27

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

OpenAI开源新模型,采用Circuit Sparsity技术实现99.9%权重为零的稀疏性,使模型计算过程可拆解、易理解,解决了传统稠密Transformer的黑箱问题。该模型通过严格约束减少无效连接,保留关键路径,从而提高决策透明度。相比MoE,Circuit Sparsity在特征流形和功能边界上更优,但当前面临高算力成本挑战。未来研究将致力于优化训练机制,提升效率与实用性。

来源:量子位

04:35

AI数据中心热潮可能对其他基础设施项目不利

AI数据中心热潮可能对其他基础设施项目不利

随着数据中心建设加速,尤其是AI相关的基础设施如大语言模型和多模态模型的部署需求激增,预计2025年将达到超过410亿美元的投资规模。这不仅与政府在交通建设上的支出相当,还导致了劳动力短缺问题加剧,影响其他基础设施项目的进度。此现象反映了AI技术快速发展对算力资源及物理空间的需求增加,同时也提出了成本控制和技术优化的新挑战。

来源:TechCrunch AI

12月 12日
1 条新闻
17:34

装机量超2000万、全球主流GPU与AI框架“开箱即用”,OpenCloudOS成AI时代优先选项

针对AI算力利用率低下及生态割裂问题,OpenCloudOS推出智能基座解决方案,通过统一操作系统底座实现异构硬件和多框架的高效兼容与调度。该方案涵盖镜像小型化、快速分发、自动化维护等关键技术升级,显著提升AI工作负载在云原生环境下的部署效率与资源利用率。此外,OpenCloudOS Infra智能基座还提供了一键安装驱动程序、标准化容器镜像等功能,极大简化了开发者的工作流程,加速AI应用的大规模落地。

来源:36氪

12月 6日
3 条新闻
02:28

没有谁想要你的钱,AWS想要赢得你的信任,而Spotify想要收集你的数据

AWS 在 re:Invent 2025 上推出了一系列新的AI代理工具,强调了其在企业级AI领域的投入,包括第三代芯片和数据库折扣。尽管如此,AWS仍需证明其在基础设施以外的竞争力。此外,讨论还涉及了AI代理的投资回报率、好莱坞与生成式AI之间的冲突以及各平台对个性化年终总结功能的竞争。

来源:TechCrunch AI

02:05

AWS re:Invent 全力推广人工智能,但客户可能尚未准备好。

AWS re:Invent 全力推广人工智能,但客户可能尚未准备好。

AWS在re:Invent技术大会上宣布了多项AI创新,包括新的AI代理和更新的大语言模型等,强调其对企业级AI的全面投入。尽管AWS CEO Matt Garman认为AI即将为企业带来实质性价值,但分析师指出许多企业尚未准备好采用AI。AWS在云基础设施方面领先,但在企业AI解决方案市场中落后于Anthropic、OpenAI和Google。AWS的优势在于提供从基础设施到自研AI训练芯片的一站式服务,然而,企业对AI的投资回报率仍存疑虑。

来源:TechCrunch AI

12月 4日
1 条新闻
10:43

DeepSeek-V3.2被找出bug了:疯狂消耗token,答案还可能出错,研究人员:GRPO老问题没解决

DeepSeek-V3.2被找出bug了:疯狂消耗token,答案还可能出错,研究人员:GRPO老问题没解决

DeepSeek-V3.2在复杂任务中表现出色,但存在token浪费问题。研究指出其GRPO算法存在长度偏见和难度偏见,导致模型生成冗长且不准确的回答。尽管DeepSeek已修正了难度偏见,长度偏见仍待解决。考虑到成本效益,DeepSeek-V3.2的价格优势显著,但128K上下文限制影响了进一步优化。

来源:36氪

12月 3日
2 条新闻
10:52

云计算一哥10分钟发了25个新品!Kimi和MiniMax首次上桌

云计算一哥10分钟发了25个新品!Kimi和MiniMax首次上桌

亚马逊云科技在re:Invent 2025上发布了近40款新品,重点围绕AI Agent、算力及模型。自研芯片Trainium4性能大幅提升,推出AI Factories实现私有数据中心部署。Amazon Bedrock平台新增多款大模型,包括中国Kimi和MiniMax,同时发布自家Nova 2系列,涵盖多模态与定制化需求。针对开发者,推出了Kiro编程助手的自主Agent、安全Agent和运维Agent,全面提升开发效率与安全性。

来源:量子位

00:00

Simular的AI代理希望为您管理Mac和Windows电脑

Simular的AI代理希望为您管理Mac和Windows电脑

Simular,一家专注于为Mac OS和Windows构建AI代理的初创公司,已筹集2150万美元A轮融资。与控制浏览器不同,Simular直接控制PC,执行复杂任务如数据复制粘贴等。其技术结合了深度学习与神经符号计算,旨在解决LLM幻觉问题,通过用户修正锁定成功轨迹,使任务可重复且确定性高。创始人背景包括Google DeepMind,具备连续学习与强化学习专长。

来源:TechCrunch AI

12月 2日
3 条新闻
23:37

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

Mistral以新开放权重前沿和小型模型逼近大型AI竞争对手

法国AI初创公司Mistral发布了其新系列的Mistral 3开放权重模型,包括一个具有多模态和多语言能力的大规模前沿模型及九个可离线运行、完全可定制的小型模型。这些模型旨在满足企业级应用需求,通过精细化调整实现更高效的任务处理。Mistral强调,在实际应用场景中,小型模型经过调优后可以匹敌甚至超越大型封闭源模型的表现,尤其在成本控制与性能优化方面展现出优势。

来源:TechCrunch AI

22:29

AI泡沫原罪:英伟达是AI戒不掉的“毒丸”?

AI泡沫原罪:英伟达是AI戒不掉的“毒丸”?

本文通过分析AI产业链核心公司的财务状况,揭示了AI投资热潮下的利润分配不均问题。在AI基建初期,云服务商面临高昂的前期投入与实际现金流紧张的矛盾;算力提供商如英伟达因垄断地位获利丰厚;而下游应用商如OpenAI则因收入增长速度不及成本增加速度而陷入亏损。文章指出,这种利润分配模式导致了整个AI产业生态链的不稳定,需要通过技术创新和商业模式优化来解决。

来源:36氪

18:22

数据中心,电力告急

数据中心,电力告急

随着AI算力需求激增,数据中心电力消耗问题日益突出。高盛报告指出,美国AI发展面临的主要障碍是电力供应。初创公司如PowerLattice和Empower正致力于研发高效电源管理芯片,旨在减少能耗并提升计算效率,预计未来几年内将实现千兆瓦级别的能源节省。同时,第三代半导体材料GaN与SiC的应用,以及800V高压直流架构的推广,将进一步推动AI基础设施向更高效、更环保的方向发展。

来源:36氪

2月 11日
2 条新闻
17:25

欧盟寻求私营部门助力资助“人工智能千兆工厂”,瞄准前沿人工智能竞赛

欧盟计划通过私营部门合作,提升 AI 基础设施能力,推动大规模模型训练。欧盟主席冯德莱恩在巴黎 AI 行动峰会上强调,需建设“AI 超级工厂”以支持前沿创新,确保算力资源普惠化。此举旨在应对美国在 AI 算力领域的竞争压力,同时促进跨领域合作,如医疗影像和气候建模。欧盟将采用开放协作模式,推动数据共享与知识整合,加速 AI 技术在经济和社会中的广泛应用。

来源:TechCrunch AI

03:30

苹果修复了用于“极其复杂攻击”的iPhone和iPad漏洞

Apple 修复了 iOS 和 iPadOS 中的一个安全漏洞,该漏洞可能被用于针对特定个体的高度复杂攻击。该漏洞允许在设备锁定时禁用 USB 限制模式,从而可能被执法机构或犯罪分子利用取证工具(如 Cellebrite 或 Graykey)访问设备数据。这一事件凸显了 AI 在网络安全领域的挑战,特别是在数据安全和隐私保护方面。AI 技术如联邦学习和强化学习可用于增强设备安全性和检测潜在威胁,未来需进一步探索 AI 在防御高级网络攻击中的应用。

来源:TechCrunch AI

2月 8日
3 条新闻
09:58

Hugging Face 全新 AI 版的 App Store

Hugging Face 全新更新了Spaces 导航功能,现在就像是一个 AI 版的 App Store,拥有超过 40 万个 Space。

用户可以通过自然语言进行搜索,轻松找到所需的应用。Spaces 涵盖了广泛的分类,包括图像、视频、音乐、文本、代码、3D 模型生成、语义分割、OCR、文档分析、翻译、游戏等等。

来源:三花快讯

03:36

特斯拉的Dojo时间线

特斯拉正通过自研超级计算机 Dojo 推动自动驾驶技术发展,旨在实现从辅助驾驶到完全自动驾驶的跨越。Dojo 专为训练 FSD 神经网络设计,结合特斯拉自研 D1 芯片,显著提升模型训练效率。尽管面临 EV 销量下滑的压力,特斯拉仍将 Dojo 视为实现完全自动驾驶的关键。通过持续优化算力与数据规模,特斯拉致力于将自动驾驶安全性提升至人类驾驶的 10 倍以上,展现了 AI 技术在自动驾驶领域的巨大潜力与挑战。

来源:TechCrunch AI

01:37

公司是否对OpenAI失去了热情?

人形机器人公司 Figure 宣布终止与 OpenAI 的合作,转向自主研发 AI 模型,并暗示将在人形机器人领域推出突破性创新。同时,斯坦福大学和华盛顿大学的研究表明,低成本训练高性能推理模型成为可能,挑战 OpenAI 高成本模式。这一趋势反映了 AI 领域对成本控制和自主创新的重视,推动更多企业探索非 OpenAI 解决方案。

来源:TechCrunch AI

2月 7日
1 条新闻
19:38

Composo助力企业监控AI应用的工作效果

伦敦初创公司 Composo 推出 AI 应用评估平台,专注于解决大语言模型(LLM)应用在准确性和一致性方面的可靠性问题。其核心创新在于结合奖励模型和自定义标准,通过无代码和 API 接口,使非技术用户也能评估 AI 应用的输出质量。Composo 已在医疗、合规等领域获得客户认可,并完成 200 万美元预种子轮融资。其技术优势在于无需依赖高资本投入的基础模型开发,而是专注于 LLM 应用的监控与优化,助力企业降低 AI 部署风险并加速落地。

来源:TechCrunch AI

2月 6日
1 条新闻
13:47

这些研究人员使用NPR周日谜题问题来评估AI“推理”模型

研究人员利用 NPR 的 Sunday Puzzle 谜题创建了一个新的 AI 推理能力基准测试,旨在评估模型在通用知识问题上的表现。该测试揭示了推理模型(如 OpenAI 的 o1 和 DeepSeek 的 R1)在解决复杂问题时可能“放弃”或提供错误答案的现象。研究表明,推理模型在自我验证方面表现较好,但存在推理时间较长、逻辑混乱等问题。该基准测试为 AI 推理能力的评估提供了新视角,未来将扩展至更多推理模型,持续追踪性能变化。

来源:TechCrunch AI

2月 5日
1 条新闻
08:07

Alphabet称赞DeepSeek,但其AI支出大幅增加

科技巨头 Alphabet 和 Meta 持续加码 AI 投资,Alphabet 宣布将资本支出提升至 750 亿美元,同比增长 42%,以加速 AI 发展。尽管 DeepSeek 等低成本 AI 模型引发市场对 AI 芯片需求下降的担忧,Alphabet CEO Sundar Pichai 强调,AI 使用成本的下降将推动更多应用场景的可行性,并通过其庞大的用户基础从中受益。Meta 也承诺长期投入数百亿美元用于 AI。两大巨头均看好 AI 推理需求的增长,认为低成本 AI 将推动服务需求激增,而非威胁其商业模式。

来源:TechCrunch AI

Back to top button