本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑TextEncodeAceStepAudio1.5 节点用于为 AceStepAudio 1.5 模型准备文本和音频相关的元数据。它接收描述性标签、歌词和音乐参数,然后使用 CLIP 模型将其转换为适用于音频生成的调节格式。
输入参数
| 参数 | 数据类型 | 必填 | 范围 | 描述 |
|---|---|---|---|---|
clip | CLIP | 是 | N/A | 用于对输入文本进行分词和编码的 CLIP 模型。 |
tags | STRING | 是 | N/A | 音频的描述性标签,例如流派、情绪或乐器。支持多行输入和动态提示。 |
lyrics | STRING | 是 | N/A | 音轨的歌词。支持多行输入和动态提示。 |
seed | INT | 否 | 0 到 18446744073709551615 | 用于可重复生成的随机种子值。带有 control_after_generate 控件。默认值:0。 |
bpm | INT | 否 | 10 到 300 | 生成音频的每分钟节拍数 (BPM)。默认值:120。 |
duration | FLOAT | 否 | 0.0 到 2000.0 | 期望的音频时长(秒)。默认值:120.0。 |
timesignature | COMBO | 否 | "2""3""4""6" | 音乐拍号。 |
language | COMBO | 否 | "en""ja""zh""es""de""fr""pt""ru""it""nl""pl""tr""vi""cs""fa""id""ko""uk""hu""ar""sv""ro""el" | 输入文本的语言。 |
keyscale | COMBO | 否 | "C major""C minor""C# major""C# minor""Db major""Db minor""D major""D minor""D# major""D# minor""Eb major""Eb minor""E major""E minor""F major""F minor""F# major""F# minor""Gb major""Gb minor""G major""G minor""G# major""G# minor""Ab major""Ab minor""A major""A minor""A# major""A# minor""Bb major""Bb minor""B major""B minor" | 音乐的调性和音阶(大调或小调)。 |
generate_audio_codes | BOOLEAN | 否 | N/A | 启用生成音频代码的 LLM。这可能会比较慢,但会提高生成音频的质量。如果为模型提供音频参考,请关闭此选项。默认值:True。 |
cfg_scale | FLOAT | 否 | 0.0 到 100.0 | 分类器自由引导尺度。值越高,输出越紧密遵循提示。默认值:2.0。 |
temperature | FLOAT | 否 | 0.0 到 2.0 | 采样温度。值越低,输出越具有确定性。默认值:0.85。 |
top_p | FLOAT | 否 | 0.0 到 2000.0 | 核心采样概率 (top-p)。默认值:0.9。 |
top_k | INT | 否 | 0 到 100 | 要考虑的最高概率标记的数量 (top-k)。默认值:0。 |
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
CONDITIONING | CONDITIONING | 调节数据,其中包含为 AceStepAudio 1.5 模型编码的文本和音频参数。 |