AI新闻

已选标签:
AI视频
12月 14日
1 条新闻
12月 12日
2 条新闻
19:38

花10亿美元,迪士尼让AI来拍“短片”了

迪士尼与OpenAI达成深度合作,授权超过200个IP元素用于Sora和ChatGPT Images中,标志着娱乐行业进入AI工业化阶段。通过生成式AI技术,粉丝可以轻松创作包含迪士尼角色的短视频和静态图像,并有机会在Disney+上展示。此次合作不仅改变了IP运营逻辑,还可能影响未来剧集生命周期评估标准。

来源:36氪

12月 4日
1 条新闻
10:42

这个模型,将革命人类的信息获取方式

这个模型,将革命人类的信息获取方式

字节跳动发布的新模型Vidi2展示了在视频内容理解与处理方面的突破,能够自动解析视频帧并提取关键信息,支持关键词搜索和视频元素编辑。这不仅提升了信息检索效率,还为新媒体创作提供了强大工具。该技术有望革新内容消费模式,加速从文字到视频的搜索转变,并在教育、监控等多个领域展现应用潜力,推动AI技术向更高效、更直观的信息处理方式发展。

来源:36氪

12月 3日
1 条新闻
12月 2日
3 条新闻
17:56

Runway Gen-4.5刷屏发布,把重量尘土和光影都做对了,网友:颠覆

Runway Gen-4.5刷屏发布,把重量尘土和光影都做对了,网友:颠覆

Runway Gen-4.5在文本转视频基准测试中以1247分超越所有现有模型,实现物理和视觉准确性突破。该模型擅长执行复杂序列式指令,生成的视频具有逼真的重量感与动量特征,适用于多种风格和场景。尽管存在因果推理等局限性,Gen-4.5展示了AI在多模态融合及内容生成领域的显著进步。

来源:量子位

12:11

AI初创公司Runway推出影片生成模型Gen 4.5,测评排名超谷歌和OpenAI

人工智能(AI)初创公司Runway周一宣布推出最新影片生成模型Gen 4.5,能依照文字指令生成高画质影片,并在第三方评测平台Video Arena夺下第一名,谷歌Veo 3排名第二,OpenAI的Sora 2 Pro则位居第七。据介绍,新模型擅长理解物理效果、人类动作、镜头运动与因果关系,能更精准地模拟真实世界情境。Gen 4.5将于本周逐步向所有Runway用户全面开放。(广角观察)

来源:钛媒体

11:53

PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

拍我AI V5.5发布,国内首款实现分镜+音频一键生成视频的大模型。该版本支持多镜头与音频同步生成,具备完整叙事能力,大幅降低视频创作门槛。用户只需输入简短提示词即可生成高质量视频,涵盖景别变化、对白、音效等。此外,平台还提供图像到视频的一体化工作流及多种编辑功能,推动AI视频成为内容生产的基础设施。

来源:量子位

2月 11日
2 条新闻
11:00

OpenAI 在超级碗首播电视广告,成本高达 1400 万美元

在第 59 届美国超级碗(Super Bowl)比赛期间,OpenAI 播出了其首个电视广告。这一广告的投放成本约为 1400 万美元(约 1.02 亿元人民币)。

我还为你们找到了制作这种风格视频的工具:一个是使用 ChatGPT Canvas 开发的 Dotted Image Effect,另一个是 ChatGPT Ad Maker。这些工具可以帮你将原有视频/图片转为 OpenAI 广告的风格。

来源:三花快讯

11:00

字节跳动推出 Goku 和 Goku+: 口播视频生成模型

Goku是字节最新发布的专注于视频生成的基础模型,能够根据文本提示生成高质量的视频内容。

此外,字节还推出了 Goku+,这是一个基于 Goku 的广告视频生成模型,专门用于生成真人出镜的口播广告视频和产品广告宣传片。

从官方的演示来看,Goku+ 生成的视频非常的逼真,不过目前只发布了论文,考虑到字节的一贯做法,这些模型大概率不会开源。

来源:三花快讯

2月 7日
1 条新闻
2月 6日
1 条新闻
00:00

人工智能的最大舞台即将开启——TechCrunch Sessions: AI 现已开放售票

TechCrunch Sessions: AI 将于6月5日在加州大学伯克利分校举办,汇聚1200名行业领袖,探讨AI领域的最新突破与未来趋势。活动涵盖专家演讲、圆桌讨论及创新展览,重点关注多模态模型、AI视频分析、企业级AI应用等前沿技术。投资专家如Shravan Narayan和Jill Chase将分享AI创业与投资经验,推动产业生态发展。活动为开发者、投资者和创新者提供交流平台,助力AI技术商业化与规模化落地。

来源:TechCrunch AI

2月 5日
2 条新闻
23:06

马斯克寻求驳回特斯拉使用AI生成《银翼杀手》影像的诉讼

特斯拉因涉嫌在发布会上使用 AI 生成的《银翼杀手 2049》版权图像而面临诉讼。原告 Alcon Entertainment 指控特斯拉通过 AI 模型复制受版权保护的图像,用于推广其未来概念车。此案突显了 AI 生成内容在商业应用中的版权风险,尤其是在涉及多模态模型和计算机视觉技术的场景下。特斯拉的辩护策略将直接影响 AI 生成内容的法律边界,可能为未来类似案例提供重要参考。

来源:TechCrunch AI

00:18

深度伪造视频令人震惊地逼真

深度伪造视频令人震惊地逼真

字节跳动推出新型AI系统OmniHuman-1,能够生成迄今为止最逼真的深度伪造视频。该系统仅需一张参考图像和音频即可生成视频,支持调整视频比例和身体比例,并能编辑现有视频。尽管存在低质量图像和特定姿势的局限性,OmniHuman-1在技术上远超以往深度伪造技术。然而,深度伪造技术的滥用已引发广泛担忧,包括政治误导和金融欺诈。2023年,AI生成内容导致的欺诈损失超过120亿美元,预计到2027年将达到400亿美元。尽管部分州已立法打击AI辅助冒充行为,但深度伪造内容的检测和监管仍面临巨大挑战。地址:https://omnihuman-lab.github.io/

来源:TechCrunch AI

2月 4日
1 条新闻
07:00

Naver支持的Cinamon希望利用AI简化3D视频动画制作

韩国初创公司 Cinamon 推出 AI 驱动的 3D 动画视频生成平台 CINEV,结合 3D 资产库、AI 运动生成和电影制作大语言模型,支持通过文本提示和滑块创建、编辑 3D 场景。该平台旨在解决现有 AI 视频生成工具的物理一致性问题,适用于长视频内容制作。CINEV 计划于 2025 年上半年推出测试版,目标用户包括漫画、游戏开发者和动画师等。Cinamon 已获得 1850 万美元融资,并加入 Nvidia 初创加速器 Inception,未来将利用投资者 IP 和 3D 资产扩展内容创作场景。

来源:TechCrunch AI

1月 23日
1 条新闻
00:00

YouTube 为 Premium 用户推出速度控制和高质量音频测试

YouTube 正在为 Premium 用户推出多项 AI 驱动的实验性功能,包括基于机器学习的“Jump Ahead”视频跳转功能,通过用户反馈和算法识别视频关键部分。此外,YouTube Music 扩展了“Ask Music”AI 功能,支持用户通过自然语言生成个性化播放列表,展示了 AI 在内容推荐和个性化体验中的应用。这些功能体现了 AI 在多模态内容理解、用户行为分析和智能推荐系统方面的进展,进一步推动了 AI 在流媒体平台的商业落地。

来源:TechCrunch AI

Back to top button