Skip to content

OpenAI Audio 操作

使用此操作可在 OpenAI 中生成音频、转录或翻译录音。有关 OpenAI 节点本身的更多信息,请参阅OpenAI

生成音频

使用此操作可以根据文本提示创建音频。

输入以下参数:

  • 要连接的凭证:创建或选择现有的OpenAI 凭证
  • 资源:选择音频
  • 操作:选择生成音频
  • 模型:选择您想要用于生成音频的模型。更多信息请参阅TTS | OpenAI。TTS
    • -1
    • :用于优化速度。TTS
    • -1-HD
    • :用于优化质量。
  • 文本输入:输入要生成音频的文本。最大长度为 4096 个字符。
  • 语音:选择生成音频时使用的语音。您可以在“文本转语音指南 | OpenAI”中收听语音预览。

选项

  • 响应格式:选择音频响应的格式。可选格式包括MP3 (默认)、 OPUSAACFLACWAVPCM
  • 音频速度:输入生成音频的速度,取值范围为到。默认为。
  • 将输出放入字段:默认为。输入用于放置二进制文件数据的输出字段名称。

请参阅创建演讲 | OpenAI文档以了解更多信息。

转录录音

使用此操作将音频转录为文本。OpenAI API 将音频文件的大小限制为 25 MB。OpenAI 将默认使用该模型。

输入以下参数:

  • 要连接的凭证:创建或选择现有的OpenAI 凭证
  • 资源:选择音频
  • 操作:选择转录录音
  • 输入数据字段名称:默认为。请以以下格式之一输入包含音频文件的二进制属性的名称: 、 、 、 、 、 、 、或。

选项

  • 音频文件的语言:以ISO-639-1格式输入音频的语言。使用此选项可提高准确性和延迟。
  • 输出随机性(温度) :默认为。调整响应的随机性。范围介于(确定性)和(最大随机性)之间。我们建议更改此值或输出随机性(最高 P) ,但不要同时更改两者。从中等温度(约 0.7)开始,并根据观察到的输出进行调整。如果响应过于重复或僵化,则增加温度。如果响应过于混乱或偏离轨道,则降低温度。

有关更多信息,请参阅创建转录 | OpenAI文档。

翻译录音

使用此操作将音频翻译成英文。OpenAI API 将音频文件的大小限制为 25 MB。OpenAI 将默认使用该模型。

输入以下参数:

  • 要连接的凭证:创建或选择现有的OpenAI 凭证
  • 资源:选择音频
  • 操作:选择翻译录音
  • 输入数据字段名称:默认为。请以以下格式之一输入包含音频文件的二进制属性的名称: 、 、 、 、 、 、 、或。

选项

  • 输出随机性(温度) :默认为。调整响应的随机性。范围介于(确定性)和(最大随机性)之间。我们建议更改此值或输出随机性(最高 P) ,但不要同时更改两者。从中等温度(约 0.7)开始,并根据观察到的输出进行调整。如果响应过于重复或僵化,则增加温度。如果响应过于混乱或偏离轨道,则降低温度。

有关更多信息,请参阅创建转录 | OpenAI文档。

常见问题

有关常见错误或问题以及建议的解决步骤,请参阅常见问题