跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
GeminiImage 节点通过谷歌的 Gemini AI 模型生成文本和图像响应。它允许您提供包括文本提示、图像和文件在内的多模态输入,以创建连贯的文本和图像输出。该节点负责与最新 Gemini 模型的所有 API 通信和响应解析。

输入参数

参数数据类型输入类型默认值取值范围描述
promptSTRING必填""-用于生成的文本提示
modelCOMBO必填gemini_2_5_flash_image_preview可用的 Gemini 模型
选项从 GeminiImageModel 枚举中提取
用于生成响应的 Gemini 模型
seedINT必填420 到 18446744073709551615当种子固定为特定值时,模型会尽力为重复请求提供相同的响应。不保证确定性输出。此外,即使使用相同的种子值,更改模型或参数设置(如温度)也可能导致响应变化。默认使用随机种子值
imagesIMAGE可选-用作模型上下文的可选图像。要包含多个图像,可以使用 Batch Images 节点
filesGEMINI_INPUT_FILES可选-用作模型上下文的可选文件。接受来自 Gemini Generate Content Input Files 节点的输入
注意:该节点包含由系统自动处理的隐藏参数(auth_tokencomfy_api_keyunique_id),无需用户输入。

输出参数

输出名称数据类型描述
IMAGEIMAGE从 Gemini 模型生成的图像响应
STRINGSTRING从 Gemini 模型生成的文本响应