跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
TextEncodeAceStepAudio1.5 节点用于为 AceStepAudio 1.5 模型准备文本和音频相关的元数据。它接收描述性标签、歌词和音乐参数,然后使用 CLIP 模型将其转换为适用于音频生成的调节格式。

输入参数

参数数据类型必填范围描述
clipCLIPN/A用于对输入文本进行分词和编码的 CLIP 模型。
tagsSTRINGN/A音频的描述性标签,例如流派、情绪或乐器。支持多行输入和动态提示。
lyricsSTRINGN/A音轨的歌词。支持多行输入和动态提示。
seedINT0 到 18446744073709551615用于可重复生成的随机种子值。带有 control_after_generate 控件。默认值:0。
bpmINT10 到 300生成音频的每分钟节拍数 (BPM)。默认值:120。
durationFLOAT0.0 到 2000.0期望的音频时长(秒)。默认值:120.0。
timesignatureCOMBO"2"
"3"
"4"
"6"
音乐拍号。
languageCOMBO"en"
"ja"
"zh"
"es"
"de"
"fr"
"pt"
"ru"
"it"
"nl"
"pl"
"tr"
"vi"
"cs"
"fa"
"id"
"ko"
"uk"
"hu"
"ar"
"sv"
"ro"
"el"
输入文本的语言。
keyscaleCOMBO"C major"
"C minor"
"C# major"
"C# minor"
"Db major"
"Db minor"
"D major"
"D minor"
"D# major"
"D# minor"
"Eb major"
"Eb minor"
"E major"
"E minor"
"F major"
"F minor"
"F# major"
"F# minor"
"Gb major"
"Gb minor"
"G major"
"G minor"
"G# major"
"G# minor"
"Ab major"
"Ab minor"
"A major"
"A minor"
"A# major"
"A# minor"
"Bb major"
"Bb minor"
"B major"
"B minor"
音乐的调性和音阶(大调或小调)。
generate_audio_codesBOOLEANN/A启用生成音频代码的 LLM。这可能会比较慢,但会提高生成音频的质量。如果为模型提供音频参考,请关闭此选项。默认值:True。
cfg_scaleFLOAT0.0 到 100.0分类器自由引导尺度。值越高,输出越紧密遵循提示。默认值:2.0。
temperatureFLOAT0.0 到 2.0采样温度。值越低,输出越具有确定性。默认值:0.85。
top_pFLOAT0.0 到 2000.0核心采样概率 (top-p)。默认值:0.9。
top_kINT0 到 100要考虑的最高概率标记的数量 (top-k)。默认值:0。

输出

输出名称数据类型描述
CONDITIONINGCONDITIONING调节数据,其中包含为 AceStepAudio 1.5 模型编码的文本和音频参数。