11:53
PixVerse(拍我AI)V5.5发布:国内首款分镜+音频一键生成AI视频大模型

拍我AI V5.5发布,国内首款实现分镜+音频一键生成视频的大模型。该版本支持多镜头与音频同步生成,具备完整叙事能力,大幅降低视频创作门槛。用户只需输入简短提示词即可生成高质量视频,涵盖景别变化、对白、音效等。此外,平台还提供图像到视频的一体化工作流及多种编辑功能,推动AI视频成为内容生产的基础设施。

来源:量子位
来源:钛媒体
来源:36氪
来源:36氪
该模型经过 20 万小时的英语语音数据训练,表现出色。除了支持本地部署外,ZyphraAI 还提供了便捷的 API 服务,用户每月可免费生成 100 分钟的音频,专业版则提供 300 分钟/5 美元的服务,超出部分按每分钟 0.02 美元计费。
值得注意的是,其中的语音克隆功能完全免费。
来源:三花快讯
此外,字节还推出了 Goku+,这是一个基于 Goku 的广告视频生成模型,专门用于生成真人出镜的口播广告视频和产品广告宣传片。
从官方的演示来看,Goku+ 生成的视频非常的逼真,不过目前只发布了论文,考虑到字节的一贯做法,这些模型大概率不会开源。
来源:三花快讯
我还为你们找到了制作这种风格视频的工具:一个是使用 ChatGPT Canvas 开发的 Dotted Image Effect,另一个是 ChatGPT Ad Maker。这些工具可以帮你将原有视频/图片转为 OpenAI 广告的风格。
来源:三花快讯