ElevenLabsTextToSpeech - ComfyUI Built-in Node Documentation

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

ElevenLabs 文本转语音节点利用 ElevenLabs API 将书面文本转换为语音音频。它允许您选择特定的语音，并微调各种语音特性，如稳定性、速度和风格，以生成定制的音频输出。

输入参数

参数	数据类型	必填	范围	描述
`voice`	CUSTOM	是	N/A	用于语音合成的语音。从 Voice Selector 或 Instant Voice Clone 节点连接。
`text`	STRING	是	N/A	要转换为语音的文本。
`stability`	FLOAT	否	0.0 - 1.0	语音稳定性。较低的值提供更广的情感范围，较高的值产生更一致但可能单调的语音（默认：0.5）。
`apply_text_normalization`	COMBO	否	`"auto"` `"on"` `"off"`	文本规范化模式。‘auto’ 由系统决定，‘on’ 始终应用规范化，‘off’ 跳过规范化。
`model`	DYNAMICCOMBO	否	`"eleven_multilingual_v2"` `"eleven_v3"`	用于文本转语音的模型。选择模型会显示其特定参数。
`language_code`	STRING	否	N/A	ISO-639-1 或 ISO-639-3 语言代码（例如 ‘en’、‘es’、‘fra’）。留空以自动检测（默认：""）。
`seed`	INT	否	0 - 2147483647	用于可重复性的种子（不保证确定性）（默认：1）。
`output_format`	COMBO	否	`"mp3_44100_192"` `"opus_48000_192"`	音频输出格式。

模型特定参数： 当 model 参数设置为 "eleven_multilingual_v2" 时，以下附加参数变为可用：

当 model 参数设置为 "eleven_v3" 时，以下附加参数变为可用：

输出名称	数据类型	描述
`audio`	AUDIO	文本转语音转换生成的音频。