AiCC

/ AI知识共创
首页知识深度AI 行业情报商业业务知识库活动
保持联系
AI INTELLIGENCE

AI 行业情报

011
269多模态AI模型突破生成模型2026/1/13

DeepSeek发布梁文锋署名新论文,开源相关记忆模块Engram

DeepSeek于12日晚发布新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。该论文为北京大学与DeepSeek共同完成,合著作者署名中出现梁文锋。论文提出条件记忆(conditional memory),通过引入可扩展的查找记忆结构,在等参数、等算力条件下显著提升模型在知识调用、推理、代码、数学等任务上的表现。同时,DeepSeek开源相关记忆模块Engram。(广角观察)

来源:钛媒体

012
269AI智能体模型突破生成模型2026/1/13

OpenAI以1亿美元收购人工智能医疗健康应用程序Torch

OpenAI已同意以约1亿美元的股权对价,收购成立仅一年的人工智能医疗健康应用程序公司Torch。Torch这款应用能够帮助用户查看并分析来自不同渠道的健康数据,包括凯撒医疗集团等医疗体系、普雷努沃等医学影像公司,以及苹果健康等运动监测类应用。收购这家初创公司,或将助力OpenAI自身的研发计划,即在智能聊天机器人ChatGPT中推出个性化健康助手功能。Torch方面表示,其产品部分依托OpenAI的人工智能模型,基于用户数据生成个性化医疗建议。目前尚不清楚这款聊天机器人形态的应用拥有多少用户,该应用现阶段仅对特定私密用户群体开放。(第一财经)

来源:钛媒体

013
269AI智能体模型突破2026/1/13

Manus和它的“8000万名员工”

来源:36氪

014
269AI智能体模型突破生成模型2026/1/13

为什么90%的AI产品都会失败?来自OpenAI和Google的50+项目血泪教训

来源:36氪

015
269多模态AI模型突破生成模型2026/1/13

刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了

刚刚,梁文锋署名开源「记忆」模块,DeepSeek V4更细节了

DeepSeek 联合北京大学发布新论文,提出条件记忆(conditional memory)以解决现有 Transformer 缺乏原生知识查找机制的问题。通过引入 Engram 模块,实现了 O(1) 时间复杂度的知识检索,显著提升模型性能。此研究揭示了神经计算与静态记忆间的最优权衡关系,为下一代稀疏大模型提供关键建模原语。

🔗 [DeepSeek 开源武器库]:https://github.com/deepseek-ai/Engram
🔗 [核心技术战略白皮书]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

016
269AI智能体制度设计能源竞争2026/1/13

马斯克按下倒计时:电力是AI时代唯一的“军备”

马斯克按下倒计时:电力是AI时代唯一的“军备”

马斯克警告全球,未来的竞争核心在于能源而非芯片。他指出中国凭借强大的基建能力,在电力供应上已占据优势,成为科技发展的关键’印钞机’。然而,这背后隐藏着制度设计与社会公平的挑战,如数据产权、算力交易机制等。真正的竞赛不仅在于硬件建设,更在于能否构建适应智能时代的包容性制度体系。

来源:36氪

017
269AI智能体多模态AI模型突破2026/1/13

Anthropic深夜放出王炸,白领饭碗要被AI砸了?网友:不支持Linux,差评

Anthropic深夜放出王炸,白领饭碗要被AI砸了?网友:不支持Linux,差评

Anthropic 的 Claude Code 超越了编程助手的角色,成为多任务数字同事。基于这一发现,Anthropic 推出了 Cowork,一款面向日常工作的智能协作工具,支持文档整理、报告生成等非编码工作。Cowork 引入了虚拟机隔离和浏览器自动化等功能,旨在提供更安全且高效的用户体验。它不仅标志着从‘对话助手’到‘数字同事’的转变,还强调了用户在实际工作环境中的协同需求。

🔗 [Cowork 研究预览版介绍]:https://claude.com/blog/cowork-research-preview
🔗 [Boris Cherny X 发帖]:https://x.com/bcherny/status/2010809450844831752
🔗 [Reddit 讨论串]:https://www.reddit.com/r/singularity/comments/1qb6qv1/introducing_cowork_claude

来源:36氪

018
269AI智能体模型突破生成模型2026/1/13

企业 Agent 为何多半是玩具?差的不是模型,是品味

Replit CEO Amjad Masad 指出,当前AI Agent看似全能却低效,真正的突破在于建立以‘品味’为核心的工程标准。这不仅包括预设业务框架、限定可信数据范围,还涉及闭环验证流程。Replit通过制定规则、限定答案范围和增加资源投入,确保生成内容的可靠性。最终,AI的竞争将从模型能力转向严谨的工程交付力。

来源:36氪

019
269AI云模型突破生成模型2026/1/13

云厂商的AI决战

云厂商的AI决战

AI云的竞争已从单一的算力供给,升级为涵盖训练、推理、部署等全生命周期的AI Infra较量。忽视多维度竞争要素,仅关注Token使用量将导致战略短视。头部云厂商正通过自研芯片与模型、优化Infra来构建核心竞争力,形成难以逾越的技术壁垒。这不仅关乎成本控制,更是决定未来市场格局的关键。

来源:36氪

020
269多模态AI模型突破生成模型2026/1/13

梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

梁文锋署名新论文,DeepSeek V4架构首曝?直击Transformer致命缺陷

DeepSeek联合北大发布新论文,直击Transformer缺乏原生知识查找机制的痛点。通过引入Engram模块,实现了O(1)时间复杂度的知识检索,显著提升了模型在推理、代码及数学任务上的表现。这一创新不仅解决了计算效率问题,还为稀疏化LLM提供了新的方向。研究发现MoE与Engram之间存在U形scaling law,表明两者间需找到最优资源配比以实现性能最大化。

🔗 [认知原点]:https://github.com/deepseek-ai/Engram/blob/main/Engram_paper.pdf

来源:36氪

共 546 条
123...55
第 2 / 55 页

We don't just produce information, we reconstruct knowledge. Elevating AI efficiency to an architectural art form.

Follow
公众号
公众号:AI知识共创
小程序
小程序:AI信息王哥
Explore
  • 首页
  • 知识深度
  • AI 行业情报
  • 商业业务
  • 知识库
  • 活动
Connect
  • 活动论坛
  • AI账号
  • 提示词商城
  • AI网址导航
  • 自媒体进化
  • AI应用分享
© 2023 AiCC · JOVI / AI Creative commons
POWERED BY Claude code