OpenAI Audio 操作
使用此操作可在 OpenAI 中生成音频、转录或翻译录音。有关 OpenAI 节点本身的更多信息,请参阅
OpenAI 。生成音频
使用此操作可以根据文本提示创建音频。
输入以下参数:
- 要连接的凭证:创建或选择现有的OpenAI 凭证。
- 资源:选择音频。
- 操作:选择生成音频。
- 模型:选择您想要用于生成音频的模型。更多信息请参阅TTS | OpenAI。TTS
- -1
- :用于优化速度。TTS
- -1-HD
- :用于优化质量。
- 文本输入:输入要生成音频的文本。最大长度为 4096 个字符。
- 语音:选择生成音频时使用的语音。您可以在“文本转语音指南 | OpenAI”中收听语音预览。
选项
- 响应格式:选择音频响应的格式。可选格式包括MP3 (默认)、 OPUS 、 AAC 、 FLAC 、 WAV和PCM 。
- 音频速度:输入生成音频的速度,取值范围为到。默认为。
- 将输出放入字段:默认为。输入用于放置二进制文件数据的输出字段名称。
请参阅
创建演讲 | OpenAI文档以了解更多信息。转录录音
使用此操作将音频转录为文本。OpenAI API 将音频文件的大小限制为 25 MB。OpenAI 将默认使用该模型。
输入以下参数:
- 要连接的凭证:创建或选择现有的OpenAI 凭证。
- 资源:选择音频。
- 操作:选择转录录音。
- 输入数据字段名称:默认为。请以以下格式之一输入包含音频文件的二进制属性的名称: 、 、 、 、 、 、 、或。
选项
- 音频文件的语言:以ISO-639-1格式输入音频的语言。使用此选项可提高准确性和延迟。
- 输出随机性(温度) :默认为。调整响应的随机性。范围介于(确定性)和(最大随机性)之间。我们建议更改此值或输出随机性(最高 P) ,但不要同时更改两者。从中等温度(约 0.7)开始,并根据观察到的输出进行调整。如果响应过于重复或僵化,则增加温度。如果响应过于混乱或偏离轨道,则降低温度。
有关更多信息,请参阅
创建转录 | OpenAI文档。翻译录音
使用此操作将音频翻译成英文。OpenAI API 将音频文件的大小限制为 25 MB。OpenAI 将默认使用该模型。
输入以下参数:
- 要连接的凭证:创建或选择现有的OpenAI 凭证。
- 资源:选择音频。
- 操作:选择翻译录音。
- 输入数据字段名称:默认为。请以以下格式之一输入包含音频文件的二进制属性的名称: 、 、 、 、 、 、 、或。
选项
- 输出随机性(温度) :默认为。调整响应的随机性。范围介于(确定性)和(最大随机性)之间。我们建议更改此值或输出随机性(最高 P) ,但不要同时更改两者。从中等温度(约 0.7)开始,并根据观察到的输出进行调整。如果响应过于重复或僵化,则增加温度。如果响应过于混乱或偏离轨道,则降低温度。
有关更多信息,请参阅
创建转录 | OpenAI文档。常见问题
有关常见错误或问题以及建议的解决步骤,请参阅
常见问题。