跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
Kandinsky5ImageToVideo 节点为使用 Kandinsky 模型生成视频准备条件数据和潜在空间数据。它会创建一个空的视频潜在张量,并可选择性地编码起始图像以引导生成视频的初始帧,同时相应地修改正向和负向条件数据。

输入参数

参数名数据类型必填取值范围描述
positiveCONDITIONINGN/A用于引导视频生成的正向条件提示。
negativeCONDITIONINGN/A用于使视频生成避开某些概念的负向条件提示。
vaeVAEN/A用于将可选的起始图像编码到潜在空间的 VAE 模型。
widthINT16 至 8192(步长 16)输出视频的宽度(像素)(默认:768)。
heightINT16 至 8192(步长 16)输出视频的高度(像素)(默认:512)。
lengthINT1 至 8192(步长 4)视频的帧数(默认:121)。
batch_sizeINT1 至 4096同时生成的视频序列数量(默认:1)。
start_imageIMAGEN/A可选的起始图像。如果提供,它将被编码并用于替换模型输出潜在张量的噪声起始部分。
注意: 当提供 start_image 时,它会自动使用双线性插值调整大小以匹配指定的 widthheight。图像批次的前 length 帧将用于编码。编码后的潜在表示随后会被注入到 positivenegative 条件数据中,以引导视频的初始外观。

输出参数

输出名称数据类型描述
positiveCONDITIONING修改后的正向条件数据,可能已更新为编码后的起始图像数据。
negativeCONDITIONING修改后的负向条件数据,可能已更新为编码后的起始图像数据。
latentLATENT一个由零填充的空视频潜在张量,其形状符合指定的维度。
cond_latentLATENT所提供起始图像的干净、编码后的潜在表示。这在内部用于替换生成的视频潜在张量的噪声起始部分。