本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑StableZero123_Conditioning 节点通过处理输入图像和相机角度,生成用于3D模型生成的条件数据和潜在表示。该节点使用CLIP视觉模型对图像特征进行编码,将其基于仰角和方位角的相机嵌入信息相结合,并为下游3D生成任务生成正向/负向条件数据及潜在表示。
输入参数
| 参数名 | 数据类型 | 必填 | 取值范围 | 描述 |
|---|---|---|---|---|
clip视觉 | CLIP_VISION | 是 | - | 用于编码图像特征的CLIP视觉模型 |
初始图像 | IMAGE | 是 | - | 待处理和编码的输入图像 |
vae | VAE | 是 | - | 用于将像素编码到潜在空间的VAE模型 |
宽度 | INT | 否 | 16至MAX_RESOLUTION | 潜在表示的输出宽度(默认:256,必须能被8整除) |
高度 | INT | 否 | 16至MAX_RESOLUTION | 潜在表示的输出高度(默认:256,必须能被8整除) |
批量大小 | INT | 否 | 1至4096 | 批次中生成的样本数量(默认:1) |
俯仰角 | FLOAT | 否 | -180.0至180.0 | 相机仰角(单位:度,默认:0.0) |
方位角 | FLOAT | 否 | -180.0至180.0 | 相机方位角(单位:度,默认:0.0) |
width和height参数必须能被8整除,因为节点会自动将其除以8来创建潜在表示维度。
输出结果
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
负面条件 | CONDITIONING | 结合图像特征和相机嵌入的正向条件数据 |
Latent | CONDITIONING | 零初始化特征的负向条件数据 |
latent | LATENT | 维度为[batch_size, 4, height//8, width//8]的潜在表示 |