跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
StableZero123_Conditioning 节点通过处理输入图像和相机角度,生成用于3D模型生成的条件数据和潜在表示。该节点使用CLIP视觉模型对图像特征进行编码,将其基于仰角和方位角的相机嵌入信息相结合,并为下游3D生成任务生成正向/负向条件数据及潜在表示。

输入参数

参数名数据类型必填取值范围描述
clip视觉CLIP_VISION-用于编码图像特征的CLIP视觉模型
初始图像IMAGE-待处理和编码的输入图像
vaeVAE-用于将像素编码到潜在空间的VAE模型
宽度INT16至MAX_RESOLUTION潜在表示的输出宽度(默认:256,必须能被8整除)
高度INT16至MAX_RESOLUTION潜在表示的输出高度(默认:256,必须能被8整除)
批量大小INT1至4096批次中生成的样本数量(默认:1)
俯仰角FLOAT-180.0至180.0相机仰角(单位:度,默认:0.0)
方位角FLOAT-180.0至180.0相机方位角(单位:度,默认:0.0)
注意: widthheight参数必须能被8整除,因为节点会自动将其除以8来创建潜在表示维度。

输出结果

输出名称数据类型描述
负面条件CONDITIONING结合图像特征和相机嵌入的正向条件数据
LatentCONDITIONING零初始化特征的负向条件数据
latentLATENT维度为[batch_size, 4, height//8, width//8]的潜在表示