- 目的: 准备使用 Wan 2.1 Fun Control 模型进行视频生成所需的条件信息。
输入
| 参数名称 | 必需 | 数据类型 | 描述 | 默认值 |
|---|---|---|---|---|
| positive | 是 | CONDITIONING | 标准 ComfyUI 正条件数据,通常来自“CLIP Text Encode”节点。正提示描述用户设想的生成视频的内容、主题和艺术风格。 | N/A |
| negative | 是 | CONDITIONING | 标准 ComfyUI 负条件数据,通常由“CLIP Text Encode”节点生成。负提示指定用户希望在生成视频中避免的元素、风格或伪影。 | N/A |
| vae | 是 | VAE | 需要与 Wan 2.1 Fun 模型系列兼容的 VAE(变分自编码器)模型,用于编码和解码图像/视频数据。 | N/A |
| width | 是 | INT | 输出视频帧的期望宽度(以像素为单位),默认值为 832,最小值为 16,最大值由 nodes.MAX_RESOLUTION 决定,步长为 16。 | 832 |
| height | 是 | INT | 输出视频帧的期望高度(以像素为单位),默认值为 480,最小值为 16,最大值由 nodes.MAX_RESOLUTION 决定,步长为 16。 | 480 |
| length | 是 | INT | 生成视频中的总帧数,默认值为 81,最小值为 1,最大值由 nodes.MAX_RESOLUTION 决定,步长为 4。 | 81 |
| batch_size | 是 | INT | 一次生成的视频数量,默认值为 1,最小值为 1,最大值为 4096。 | 1 |
| clip_vision_output | 否 | CLIP_VISION_OUTPUT | (可选)由 CLIP 视觉模型提取的视觉特征,允许进行视觉风格和内容指导。 | 无 |
| start_image | 否 | IMAGE | (可选)影响生成视频开头的初始图像。 | 无 |
| control_video | 否 | IMAGE | (可选)允许用户提供经过预处理的 ControlNet 参考视频,以指导生成视频的运动和潜在结构。 | 无 |
输出
| 参数名称 | 数据类型 | 描述 |
|---|---|---|
| positive | CONDITIONING | 提供增强的正条件数据,包括编码的 start_image 和 control_video。 |
| negative | CONDITIONING | 提供同样增强的负条件数据,包含相同的 concat_latent_image。 |
| latent | LATENT | 一个字典,包含一个空的潜在张量,键为“samples”。 |