跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
ElevenLabs 文本转语音节点利用 ElevenLabs API 将书面文本转换为语音音频。它允许您选择特定的语音,并微调各种语音特性,如稳定性、速度和风格,以生成定制的音频输出。

输入参数

参数数据类型必填范围描述
voiceCUSTOMN/A用于语音合成的语音。从 Voice Selector 或 Instant Voice Clone 节点连接。
textSTRINGN/A要转换为语音的文本。
stabilityFLOAT0.0 - 1.0语音稳定性。较低的值提供更广的情感范围,较高的值产生更一致但可能单调的语音(默认:0.5)。
apply_text_normalizationCOMBO"auto"
"on"
"off"
文本规范化模式。‘auto’ 由系统决定,‘on’ 始终应用规范化,‘off’ 跳过规范化。
modelDYNAMICCOMBO"eleven_multilingual_v2"
"eleven_v3"
用于文本转语音的模型。选择模型会显示其特定参数。
language_codeSTRINGN/AISO-639-1 或 ISO-639-3 语言代码(例如 ‘en’、‘es’、‘fra’)。留空以自动检测(默认:"")。
seedINT0 - 2147483647用于可重复性的种子(不保证确定性)(默认:1)。
output_formatCOMBO"mp3_44100_192"
"opus_48000_192"
音频输出格式。
模型特定参数:model 参数设置为 "eleven_multilingual_v2" 时,以下附加参数变为可用:
  • speed: 语速。1.0 为正常,<1.0 更慢,>1.0 更快(默认:1.0,范围:0.7 - 1.3)。
  • similarity_boost: 相似度增强。值越高,语音与原始语音越相似(默认:0.75,范围:0.0 - 1.0)。
  • use_speaker_boost: 增强与原始说话者语音的相似度(默认:False)。
  • style: 风格夸张度。值越高,风格表达越强,但可能降低稳定性(默认:0.0,范围:0.0 - 0.2)。
model 参数设置为 "eleven_v3" 时,以下附加参数变为可用:
  • speed: 语速。1.0 为正常,<1.0 更慢,>1.0 更快(默认:1.0,范围:0.7 - 1.3)。
  • similarity_boost: 相似度增强。值越高,语音与原始语音越相似(默认:0.75,范围:0.0 - 1.0)。

输出

输出名称数据类型描述
audioAUDIO文本转语音转换生成的音频。