Veo 3 发布至今已有一个多月了,自那时起,我就一直渴望尝试这款 Gen AI 奇迹。现在,等待终于结束了!谷歌已向全球所有专业用户发布了 Veo 3,而且我还找到了免费使用的方法。毕竟,有志者事竟成。在这篇文章中,我们将探讨使用 Veo 3 可以完成的不同任务,如何编写提示以充分利用 Veo 3,以及最后介绍使用它的不同方法。希望您感到兴奋,因为我显然也很兴奋。
什么是Veo 3?
Veo 3 是视频创作者的梦想,它蕴含着生成式人工智能的智慧。这是一款人工智能视频生成器应用程序,允许用户生成时长 8 秒的高质量视频。它提供 4K 输出,对物理学有着深入的理解,具有更佳的提示一致性和增强的创作控制力。
所有这些听起来可能很棒——但相信我,最好的还在后头。
Veo 3 视频还带有音频。您可以为想要生成的视频添加音效、环境噪音甚至对话。您甚至无需执行任何额外操作即可获取这些音频,只需在相同的提示中描述它,它就会与视频一起原生生成。
要详细了解 Veo 3 的功能,您可以参考文章:Veo 3 是否值得大肆宣传?
Veo 3 有两个版本:
- Veo 3:它是一款先进的视频生成模型,随 Google AI Ultra 计划提供,每月收费 250 美元。
- Veo 3 快速版:一款速度优化的高质量视频生成模型,以更快的速度提供出色的视频输出。该模型随 Google Pro AI 计划提供,每月收费 20 美元。
使用Veo 3的3个技巧
视频如今已成为社交货币。它们能够提升您的社交影响力,提升您的工作项目,并将您的创意变为现实。Veo 3 可以帮助您完成所有“视频”工作。我使用 Veo 3 完成的三个任务是:
- 制作病毒式视频
- 制作电影镜头
- 制作产品广告
现在,让我们来展现 Veo 3 的魔力。
病毒短片
提示词:
清晨,阳光透过唐楼细窗洒进一间小厨房。一位穿着卡通睡衣外搭塑胶花围裙的妈妈正在煮早餐,一脸沮丧。他转向智能喇叭,用普通话喊道:‘Alexa,几时先有得食啊? ! ‘
镜头切换到一个侧面入画的人形机器人,系着围裙,手里拿着擀面棍。这个机器人银色闪亮,面部LED灯很友善。
他停顿了一下,然后用平静的声音回答道:‘妈妈,你好吗? ‘
镜头切换到阿妈震惊的面部特写。
加上一段戏剧性的锣鼓点。用肥皂剧风格定格他震惊的反应。
风格:轻松讽刺,处境喜剧式的现实主义
镜头:广角镜头→特写→中景镜头→拉近定格
音频:广东话台词、锣鼓刺耳声、厨房环境音
输出:
我的评价
这段视频非常搞笑,和我预想的差不多。对话的流畅度和视频的流畅度也相当不错。我注意到一些问题:一些过渡瑕疵,一些角色的位置变换导致动作不一致,而且我发现音频可能会与提示词差生偏差。总的来说,第一次拍摄就取得了相当不错的效果!
需要注意的是:Veo 3 会严格遵循指示。所以,在那些显而易见的地方,一定要添加细节,即使是细微的细节,也要确保生成的视频更接近你的想象。
电影般的镜头
提示词:
{
“场景”:“夜晚,一个充满未来感的游戏竞技场,照耀着刺眼的红色灯光。”,
“角色”:[
{
“角色”:“选手”,
“外貌”:“身穿战斗感十足的黄色比赛运动服,汗流浃背,眼神充满恐惧感”,
“情绪”:“紧张,不安,恐惧”
}
],
“镜头”:[
“竞技场广角镜头,两名选手对峙”,
“特写镜头,其中一名选手惊恐的眼神”,
“切换到站在他们身后的警卫”,
“随着蜂鸣器响起,镜头拉近选手”
],
“音频”:{
“音乐”:“悬念迭起的重低音配乐”,
“音效”:[“金属蜂鸣器”,“心跳”,“金属门砰的一声”],
“对话”: []
},
“风格”: “电影惊悚片,受《鱿鱼游戏》启发”,
“时长”: “8 秒”
}
输出:
我的评价
这段视频的灵感来源于《鱿鱼游戏》,最终成品也与它非常相似。镜头生成得非常出色,捕捉到了参赛者眼中的恐惧,以及他们的呼吸声和竞技场的警笛声。虽然在开场时,我更希望能看到其他参赛者,但正如我在提示中提到的,即使没有其他参赛者,视频也同样不错。
需要记住的一点是:务必强调你希望模型关注的部分。
3. 产品短片
提示词:
兵乓球比赛场内两位运动员全神贯注地站立在球桌两头,场馆内呐喊声四起,灯光璀璨。
身着红色短袖球服的队员,发球,自信而随意;另一个身着蓝色球服的队员,专注而冷静。两人都手持乒乓球拍,动作迅速。他们随着节拍的起伏旋转着球拍。
首先是全场广角无人机镜头。球员发球时,推拉镜头紧跟乒乓球运动轨迹。与节拍同步的球拍击球特写。抛球的微距镜头,时间逐渐放慢。节拍落下:慢动作球拍击球,随后是一连串快速、有节奏的对打。最后一个广角镜头,扣杀落地。球在空中定格。标志和标语出现在画面中央。
音乐:120 BPM 的电子节奏,前 4 秒紧张感增强,第 4 秒时强劲低音。音效与音乐同步——拍子敲击与小军鼓匹配,球弹跳与底鼓匹配,扣杀与低音下降匹配。无对话。标志淡入时,会响起轻柔的铃声。
8秒弧线:球员入场(0-2秒),拍子敲击和抛球(2-4秒),节拍下降和对打(4-6秒),最终扣杀和定格(6-8秒)。
视觉基调:电影感十足,灵感源自音乐视频,充满活力。配色:暖金色、深绿色、柔和阴影。
屏幕文字(7秒处):
Nike -“Just Do It.”
输出:
我的点评
这段视频可能是我最不喜欢的。视频包含了提示中提到的所有元素,但也存在一些问题。比如运动员的站立位置,比赛过程的动作等。
需要注意的一点是:Veo 3 在运动场景方面,还需要继续提升。
如何编写Veo 3提示?
Veo 3 功能丰富,借助一些巧妙的提示,您可以充分发挥创造力。Veo 3 的提示需要具备以下结构:
- 空间 + 时间结构:空间和时间结构为场景提供背景,并决定场景中事件发生的顺序。
- 角色细节:这些细节向模型展现了不同角色及其独特特征,使 Veo 3 能够恰当地呈现他们的情绪。
- 电影流程:它讲述动作的执行过程。摄像机方向暗示了任何场景的情绪和基调。
- 音频对齐:它确保场景、音频(或对话/音乐)和谐地配合。
- 清晰的时间叙事弧:它规定了视频从开头、中间到结尾的时间弧,从而为视频提供了整体结构。
另外,如果你注意到的话,我生成的三个视频遵循了三种不同的提示结构。
- 第一个视频缺乏适当的结构。
- 第二个视频有结构,但它是以 JSON 格式编写的。
- 第三个视频有结构,并且是以文本格式编写的。
其中,我发现最好的输出来自第二个提示——结构 + JSON。事实上,我发现网上有很多人提到了同样的事情。但在你最终确定方法之前,请务必进行自己的测试。
小结
我感觉自己正处于回答这个问题的十字路口,因为一方面,它的输出远比我们迄今为止在其他图像生成模型中看到的效果要好得多;另一方面,它还有很多需要改进的地方。但如果你需要创意支持来审核他们的想法,那么 Veo 3 是必须的!它可以节省时间,并为你的想法提供一个平台。但如果你和我一样,不经常使用视频,那么也许你仍然可以等待,或者只是找到一些有创意的免费方法来继续使用 Veo 3。
评论留言