logo录咖

AI 语音转文字

AI智能识别音视频,快速转成文字。运用多种顶级 AI大模型,识别准确率高;还支持翻译成多种语言,覆盖全世界主流语种。

1.创建任务

POST https://techsz.aoscdn.com/api/tasks/audio/recognition

Request Params

  • url * string

    文件URL,文件的URL,必须为可解析的HTTP协议URL;如果URL的path没有文件扩展名,需要额外指定extension参数,比如extension=mp3;最长512个字符串;下载超时5分钟(如果5分钟未下载完成则失败)

  • type * int

    模式-请填4

  • content_type * int

    内容类型,固定填1

  • extension string

    文件扩展名,如果URL的path没有文件扩展名,需要额外指定。

  • language string

    音频文件的语言,可不填写,默认会自动检测到的语种输出,支持的语种

  • speaker_recognition int

    说话人识别,识别出不同的说话人,0-不识别(默认),1-识别

Response Params

  • task_id string

    任务ID,后续查询进度需要该task id

Copyright © 2025 深圳市网旭科技有限公司 保留所有权利 服务协议隐私政策Cookies策略许可协议
返回顶部

本网站使用为确保网站正常运营所必要的cookie,只有在您同意的前提下才会放置其它cookie。 了解详细信息,请查看我们的 Cookie政策。