刚刚,AI视频王更新了!硬索拉,威尔史密斯吃更
栏目:行业动态 发布时间:2025-10-17 09:44
Openai不久前刚刚推出了Sora 2视频生成模型,势头相当猛。紧随其后的是,现在 Google 的 VEO 3.1 也进行了重大升级。具体来说,谷歌的升级包括两个级别。首先是提高功能水平。视频编辑功能得到了改进,用户现在可以对剪辑进行更细致的调整,并对最终图像进行更精确的控制。更重要的是,谷歌首次将音频与“视频内容”、“视频帧”和“扩展”功能配对,使其成为创作过程的一部分。二是模型层面的开发。今天发布的VEO 3.1显着提升了文字即时理解和视听质量两项主要指标,使视频中的画面更加自然流畅。相关阅读 众所周知,VEO 3 已经具备了很多编辑功能——你可以使用参考图像来指导角色生成、填写 middle第一帧和最后一帧的内容,并以视频结尾为基础继续延伸。 VEO 3.1的做法是为所有这些现有功能添加音频支持,允许用户创建更完整的场景。这些功能目前正处于实验阶段,谷歌表示将根据用户反馈继续进行优化和迭代。现在用户可以使用以下功能: 1. 使用多个参考图像来定义角色、物体和样式,“素材转视频”功能将根据这些素材生成最终场景。 2或者给出画面的介绍和结束,并让“帧转视频”功能在中间生成无缝过渡。这对于需要艺术转移的项目特别有用。 3、如果要生成更长的视频,“延长”功能可以生成超过一分钟的内容,并在上一段的基础上继续生成,以保持故事的统一性。伊藤·艾·纳格卡卡哈拉加ng banggitin na ang teksto-to-video ng VEO 3 ay Suportado lamang ng 720p na pahalang na 屏幕输出,ngunit bilang 垂直屏幕视频 ay naging pangunahing 格式 para sa nilalaman ng Internet,ang VEO 3.1 ay maaari Ring makabuo ng parehong pahalang at patayong screen 16: 9 na mga video, Na Kung Saan ay higit na naaayon sa kasalukuyang mga 习惯 ng pagkonsumo ng nilalaman。完善想法往往需要反复迭代。自 iTo 年 5 月推出该流程以来,用户已在该应用程序上创建了超过 2.75 亿个视频。在吸收了用户的反馈后,两个新的流程编辑功能为此诞生了——“插入新元素”允许用户随时添加内容,流程会自动处理阴影和灯光,使新部分与原始图像自然融合; “删除对象”功能(即将推出)可以删除不必要的元素,流程将自动重建背景以保持一致性。组合o这两个工具使得视频编辑过程更加灵活。目前,VEO 3.1模型已上线,开发者可以通过Gemini API使用,企业用户可以在顶点aAko上使用,普通用户也可以在Gemini应用中体验。 Gemini API 和 Vertex AI 中也同步开放新功能。我们经历并开发了三个最实用的VEO应用场景。前几个小时流行的第一人称视角之旅、ASMR切水果、金属、兔子蹦床夜视监控视频都是用veo 3制作的。水果的内部是玻璃,还有一点融化的闪光。整个场景从上方柔和地照亮。就像这个制作柠檬杯的例子一样。提示要求“柠檬由水平切割的黄色玻璃制成,内部也是玻璃制成,内部有融化的闪光,顶部有柔和的照明。” VEO 3 的输出可用,但 VEO 3.1'“融化的闪光”细节更加准确。在电商场景中,我们直接要求他做一个产品广告。要知道,一般的TVC(电视广告)传达品牌信息的时间大约是15秒/30秒。 ▲ Sora 2生成,提示词:根据以下产品信息,生成电商广告视频,包括实景产品演示、3D旋转细节、使用场景对比、配套字幕。智能手表 X2,7 天续航,1299 元 智能手表,50 米防水,健康监测(心电图、睡眠) Sora 2 用中文语音仔细讲解产品信息,体现更好的理解。不过VEO 3.1只是增加了音乐,没有Sora 2那么周到。不过从画质来看,VEO 3.1的视觉呈现更高级,也更商业化。 ▲ 由 VEO 3.1 生成 我们还测试了动画生成,这次 VEO 3.1 的表现相当一般。 ▲ 由 Sora 生成2、提示语:在吉卜力工作室的动画风格中,一个男孩和他的狗跑上一座壮观的草山。背景中可以看到一个村庄,美丽的云朵在天空中漂浮。显然,VEO 3.1在这方面的训练数据还不够丰富,距离吉卜力工作室鲜明的动画风格还有很长的路要走。狗莫名其妙消失是AI帮派的共同特征。 ▲ x 由VEO 3.1网友@aisear生成Chio分享的威尔·史密斯吃面测试Demo的整体质感提升了一个档次。动作的流畅度和光影细节明显提升,表情丰富但不被破坏。综合来看,VEO 3.1足以用于级别和商业级别的内容生成,并且理解细节的能力也大大提高。不过,在某些风格的准确还原上——比如动画和图画,还是有相当大的优化空间,这需要高水平的风格约束。尽管如此,从Veo 3到Veo 3.1,从Sora到Sora 2,视频生成模型的迭代速度已经超出了人们的想象。随着AI视频生成工具将逐渐从专业工具演变为大众应用,之后你的朋友圈、短视频平台、甚至新闻源中的每一条内容都可以由AI生成。这也意味着你未来看到的每一条内容都需要再一步确认——来自真实拍摄还是由人工智能生成。作者:莫崇宇返回搜狐查看更多
服务热线
400-123-4567