Kandinsky5ImageToVideo - ComfyUI Built-in Node Documentation

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

Kandinsky5ImageToVideo 节点为使用 Kandinsky 模型生成视频准备条件数据和潜在空间数据。它会创建一个空的视频潜在张量，并可选择性地编码起始图像以引导生成视频的初始帧，同时相应地修改正向和负向条件数据。

输入参数

参数名	数据类型	必填	取值范围	描述
`positive`	CONDITIONING	是	N/A	用于引导视频生成的正向条件提示。
`negative`	CONDITIONING	是	N/A	用于使视频生成避开某些概念的负向条件提示。
`vae`	VAE	是	N/A	用于将可选的起始图像编码到潜在空间的 VAE 模型。
`width`	INT	否	16 至 8192（步长 16）	输出视频的宽度（像素）（默认：768）。
`height`	INT	否	16 至 8192（步长 16）	输出视频的高度（像素）（默认：512）。
`length`	INT	否	1 至 8192（步长 4）	视频的帧数（默认：121）。
`batch_size`	INT	否	1 至 4096	同时生成的视频序列数量（默认：1）。
`start_image`	IMAGE	否	N/A	可选的起始图像。如果提供，它将被编码并用于替换模型输出潜在张量的噪声起始部分。

注意： 当提供 start_image 时，它会自动使用双线性插值调整大小以匹配指定的 width 和 height。图像批次的前 length 帧将用于编码。编码后的潜在表示随后会被注入到 positive 和 negative 条件数据中，以引导视频的初始外观。

输出名称	数据类型	描述
`positive`	CONDITIONING	修改后的正向条件数据，可能已更新为编码后的起始图像数据。
`negative`	CONDITIONING	修改后的负向条件数据，可能已更新为编码后的起始图像数据。
`latent`	LATENT	一个由零填充的空视频潜在张量，其形状符合指定的维度。
`cond_latent`	LATENT	所提供起始图像的干净、编码后的潜在表示。这在内部用于替换生成的视频潜在张量的噪声起始部分。