跳转到主要内容
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
VAEEncodeAudio 节点使用变分自编码器(VAE)将音频数据转换为潜在表示。该节点接收音频输入,并通过 VAE 进行处理,生成压缩的潜在样本,这些样本可用于进一步的音频生成或处理任务。在编码前,节点会根据需要自动将音频重新采样至 44100 Hz。

输入参数

参数数据类型必需取值范围描述
音频AUDIO-待编码的音频数据,包含波形和采样率信息
vaeVAE-用于将音频编码到潜在空间的变分自编码器模型
注意: 如果原始采样率与 44100 Hz 不同,音频输入将自动重新采样至该值。

输出结果

输出名称数据类型描述
LATENTLATENT潜在空间中的编码音频表示,包含压缩样本